FASTA คือ FAST-All


ความรู้รอบตัว เก็บมาฝากเพราะความอยากรู้ค่ะ

วันก่อนในการอบรม เราได้พูดถึงเรื่อง FASTA format กัน คือรูปแบบของ sequence ของ DNA ที่ใช้เวลาแปะไปในโปรแกรม BLAST เพื่อทำ alignment หา gene ที่เหมือนกัน เพิ่งได้รู้จริงๆว่า คำนี้อ่านว่า ฟาสต์ เอ ไม่ใช่ ฟาสต์-ต้า ก็เลยได้เข้าไปอ่านถึงคำนี้ใน Wikipedia (http://en.wikipedia.org/wiki/FASTA) เห็นว่าเป็นความรู้รอบตัวที่ดี สำหรับคนทำงาน molecular (ที่ไม่ได้เรียนพื้นฐานมาโดยตรง เหมือนตัวเองนี่แหละค่ะ) ก็เลยแปลแบบย่อๆฝากกันค่ะ

จริงๆแล้ว FASTA นี้เป็นโปรแกรมที่เอาไว้ จัดเรียง sequence ของ DNA หรือโปรตีนที่ทำขึ้นโดย David J. Lipman and William R. Pearson ในปี 1985 โดยสมัยนั้นเรียก FASTP เพราะเอาไว้เรียงโปรตีนเพื่อหาว่าตรงกับโปรตีนตัวไหน ส่วน FASTA นั้นเกิดต่อมาในปี 1988 เพื่อให้จัดเรียงหา DNA sequence ได้ด้วย

คำนี้อ่านว่า ฟาสต์-เอ ซึ่งมาจาก FAST-All เพราะรวมทั้งในการจัดเรียง FAST-P (โปรตีน) และ FAST-N (nucleotide)

กำลังมองหาเรื่องเกี่ยวกับ DNA databases เพื่อเอามาฝากเป็นจุดตั้งต้น ค้นหา DNA sequence สำหรับพวกเราที่กำลังเริ่มอยู่ค่ะ

คำสำคัญ (Tags): #alignment#fasta#program#sequence
หมายเลขบันทึก: 61067เขียนเมื่อ 19 พฤศจิกายน 2006 16:25 น. ()แก้ไขเมื่อ 13 ธันวาคม 2012 16:48 น. ()สัญญาอนุญาต: ครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกันจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (6)

สวัสดีค่ะพี่โอ๋

FASTA เป็น format ที่ง่ายสำหรับการใช้งานมากเลยล่ะค่ะ ขออนุญาตให้ข้อมูลเพิ่มเติมนะคะ ^__^

>name

AATTTCCCGGGG

เครื่องหมาย > เป็นตัวบอกจุดเริ่มต้นของข้อมูล ตามด้วยชื่อของข้อมูล

จากนั้นก็ขึ้นบรรทัดใหม่ แล้วใส่ข้อมูลลงไป ข้อมูลในที่นี้จะเป็น sequence ของDNA, RNA or protein ก็ได้ค่ะ

โปรแกรมจะเริ่มทำงานด้วยการหาเครื่องหมาย > แล้วจึงจะวิเคราะห์ข้อมูล .. ถ้าใครลืม > ก็ขึ้น error ทันทีเลยล่ะค่ะ (หลาย ๆ คนมักจะลืมกัน อิอิ)

เขียนซะยาวเลย .. ฮ่าๆๆ

ณิช

 

บังเอิญจังเลยค่ะน้าโอ๋ วันนี้เพิ่งเรียนวิชา Bioinformatic แล้วก็ได้เรียนเกี่ยวกับ format ต่างๆ พอดี อาจารย์ของหยกก็เรียกว่า ฟาสต้าเหมือนกันนะคะนี่

มาเริ่มอ่านใหม่ บอกไว้ให้ผู้เขียนรับทราบว่า จะมีหลังไมค์ไปปรึกษา ค่ะ

ด้วยความยินดีอย่างยิ่งค่ะ คุณหมอเล็ก ถ้ามีอะไรช่วยได้ รับรองเต็มที่ค่ะ

สวัสดีค่ะ คืออยากทราบว่าแล้ว FASTQ format คืออะไรคะ ขอบคุณค่ะ

FASTQ ก็คือ รูปแบบที่มีทั้ง sequence และค่าคุณภาพที่เราอ่านจากผล sequence น่ะค่ะ ตามที่ใน WIKI บอกไว้เช่นเดียวกันว่า

"FASTQ format is a text-based format for storing both a biological sequence (usually nucleotide sequence) and its corresponding quality scores."

และมีอีกบทความที่อธิบายไว้ละเอียดดีและมีตัวอย่างให้ดู ที่นี่ ค่ะ

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท