วันก่อนในการอบรม เราได้พูดถึงเรื่อง FASTA format กัน คือรูปแบบของ sequence ของ DNA ที่ใช้เวลาแปะไปในโปรแกรม BLAST เพื่อทำ alignment หา gene ที่เหมือนกัน เพิ่งได้รู้จริงๆว่า คำนี้อ่านว่า ฟาสต์ เอ ไม่ใช่ ฟาสต์-ต้า ก็เลยได้เข้าไปอ่านถึงคำนี้ใน Wikipedia (http://en.wikipedia.org/wiki/FASTA) เห็นว่าเป็นความรู้รอบตัวที่ดี สำหรับคนทำงาน molecular (ที่ไม่ได้เรียนพื้นฐานมาโดยตรง เหมือนตัวเองนี่แหละค่ะ) ก็เลยแปลแบบย่อๆฝากกันค่ะ
จริงๆแล้ว FASTA นี้เป็นโปรแกรมที่เอาไว้ จัดเรียง sequence ของ DNA หรือโปรตีนที่ทำขึ้นโดย David J. Lipman and William R. Pearson ในปี 1985 โดยสมัยนั้นเรียก FASTP เพราะเอาไว้เรียงโปรตีนเพื่อหาว่าตรงกับโปรตีนตัวไหน ส่วน FASTA นั้นเกิดต่อมาในปี 1988 เพื่อให้จัดเรียงหา DNA sequence ได้ด้วย
คำนี้อ่านว่า ฟาสต์-เอ ซึ่งมาจาก FAST-All เพราะรวมทั้งในการจัดเรียง FAST-P (โปรตีน) และ FAST-N (nucleotide)
กำลังมองหาเรื่องเกี่ยวกับ DNA databases เพื่อเอามาฝากเป็นจุดตั้งต้น ค้นหา DNA sequence สำหรับพวกเราที่กำลังเริ่มอยู่ค่ะ
สวัสดีค่ะพี่โอ๋
FASTA เป็น format ที่ง่ายสำหรับการใช้งานมากเลยล่ะค่ะ ขออนุญาตให้ข้อมูลเพิ่มเติมนะคะ ^__^
>name
AATTTCCCGGGG
เครื่องหมาย > เป็นตัวบอกจุดเริ่มต้นของข้อมูล ตามด้วยชื่อของข้อมูล
จากนั้นก็ขึ้นบรรทัดใหม่ แล้วใส่ข้อมูลลงไป ข้อมูลในที่นี้จะเป็น sequence ของDNA, RNA or protein ก็ได้ค่ะ
โปรแกรมจะเริ่มทำงานด้วยการหาเครื่องหมาย > แล้วจึงจะวิเคราะห์ข้อมูล .. ถ้าใครลืม > ก็ขึ้น error ทันทีเลยล่ะค่ะ (หลาย ๆ คนมักจะลืมกัน อิอิ)
เขียนซะยาวเลย .. ฮ่าๆๆ
ณิช
มาเริ่มอ่านใหม่ บอกไว้ให้ผู้เขียนรับทราบว่า จะมีหลังไมค์ไปปรึกษา ค่ะ
ด้วยความยินดีอย่างยิ่งค่ะ คุณหมอเล็ก ถ้ามีอะไรช่วยได้ รับรองเต็มที่ค่ะ
สวัสดีค่ะ คืออยากทราบว่าแล้ว FASTQ format คืออะไรคะ ขอบคุณค่ะ
FASTQ ก็คือ รูปแบบที่มีทั้ง sequence และค่าคุณภาพที่เราอ่านจากผล sequence น่ะค่ะ ตามที่ใน WIKI บอกไว้เช่นเดียวกันว่า
"FASTQ format is a text-based format for storing both a biological sequence (usually nucleotide sequence) and its corresponding quality scores."
และมีอีกบทความที่อธิบายไว้ละเอียดดีและมีตัวอย่างให้ดู ที่นี่ ค่ะ