FASTA คือ FAST-All

โอ๋-อโณ
ความรู้รอบตัว เก็บมาฝากเพราะความอยากรู้ค่ะ

วันก่อนในการอบรม เราได้พูดถึงเรื่อง FASTA format กัน คือรูปแบบของ sequence ของ DNA ที่ใช้เวลาแปะไปในโปรแกรม BLAST เพื่อทำ alignment หา gene ที่เหมือนกัน เพิ่งได้รู้จริงๆว่า คำนี้อ่านว่า ฟาสต์ เอ ไม่ใช่ ฟาสต์-ต้า ก็เลยได้เข้าไปอ่านถึงคำนี้ใน Wikipedia (http://en.wikipedia.org/wiki/FASTA ) เห็นว่าเป็นความรู้รอบตัวที่ดี สำหรับคนทำงาน molecular (ที่ไม่ได้เรียนพื้นฐานมาโดยตรง เหมือนตัวเองนี่แหละค่ะ) ก็เลยแปลแบบย่อๆฝากกันค่ะ

จริงๆแล้ว FASTA นี้เป็นโปรแกรมที่เอาไว้ จัดเรียง sequence ของ DNA หรือโปรตีนที่ทำขึ้นโดย David J. Lipman and William R. Pearson ในปี 1985 โดยสมัยนั้นเรียก FASTP เพราะเอาไว้เรียงโปรตีนเพื่อหาว่าตรงกับโปรตีนตัวไหน ส่วน FASTA นั้นเกิดต่อมาในปี 1988 เพื่อให้จัดเรียงหา DNA sequence ได้ด้วย

คำนี้อ่านว่า ฟาสต์-เอ ซึ่งมาจาก FAST-All เพราะรวมทั้งในการจัดเรียง FAST-P (โปรตีน) และ FAST-N (nucleotide)

กำลังมองหาเรื่องเกี่ยวกับ DNA databases เพื่อเอามาฝากเป็นจุดตั้งต้น ค้นหา DNA sequence สำหรับพวกเราที่กำลังเริ่มอยู่ค่ะ

บันทึกนี้เขียนที่ GotoKnow โดย  ใน ประสบการณ์งาน Molecular มาแลกเปลี่ยน

คำสำคัญ (Tags)#program#sequence#fasta#alignment

หมายเลขบันทึก: 61067, เขียน: 19 Nov 2006 @ 16:25 (), แก้ไข: 13 Dec 2012 @ 16:48 (), สัญญาอนุญาต: ครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน, ดอกไม้: 1, ความเห็น: 6, อ่าน: คลิก


ความเห็น (6)

Genuine
เขียนเมื่อ 

สวัสดีค่ะพี่โอ๋

FASTA เป็น format ที่ง่ายสำหรับการใช้งานมากเลยล่ะค่ะ ขออนุญาตให้ข้อมูลเพิ่มเติมนะคะ ^__^

>name

AATTTCCCGGGG

เครื่องหมาย > เป็นตัวบอกจุดเริ่มต้นของข้อมูล ตามด้วยชื่อของข้อมูล

จากนั้นก็ขึ้นบรรทัดใหม่ แล้วใส่ข้อมูลลงไป ข้อมูลในที่นี้จะเป็น sequence ของDNA, RNA or protein ก็ได้ค่ะ

โปรแกรมจะเริ่มทำงานด้วยการหาเครื่องหมาย > แล้วจึงจะวิเคราะห์ข้อมูล .. ถ้าใครลืม > ก็ขึ้น error ทันทีเลยล่ะค่ะ (หลาย ๆ คนมักจะลืมกัน อิอิ)

เขียนซะยาวเลย .. ฮ่าๆๆ

ณิช

 

หยก
IP: xxx.120.235.25
เขียนเมื่อ 
บังเอิญจังเลยค่ะน้าโอ๋ วันนี้เพิ่งเรียนวิชา Bioinformatic แล้วก็ได้เรียนเกี่ยวกับ format ต่างๆ พอดี อาจารย์ของหยกก็เรียกว่า ฟาสต้าเหมือนกันนะคะนี่

มาเริ่มอ่านใหม่ บอกไว้ให้ผู้เขียนรับทราบว่า จะมีหลังไมค์ไปปรึกษา ค่ะ

ด้วยความยินดีอย่างยิ่งค่ะ คุณหมอเล็ก ถ้ามีอะไรช่วยได้ รับรองเต็มที่ค่ะ

กาญจนา
IP: xxx.188.74.10
เขียนเมื่อ 

สวัสดีค่ะ คืออยากทราบว่าแล้ว FASTQ format คืออะไรคะ ขอบคุณค่ะ

FASTQ ก็คือ รูปแบบที่มีทั้ง sequence และค่าคุณภาพที่เราอ่านจากผล sequence น่ะค่ะ ตามที่ใน WIKI บอกไว้เช่นเดียวกันว่า

"FASTQ format is a text-based format for storing both a biological sequence (usually nucleotide sequence) and its corresponding quality scores."

และมีอีกบทความที่อธิบายไว้ละเอียดดีและมีตัวอย่างให้ดู ที่นี่ ค่ะ