บันทึกนี้เกี่ยวกับ การแนะนำไบโอไพธัน การติดตั้งและทดสอบเวอร์ชั่น 1.49 จาก source
โปรแกรมไบโอไพธัน เป็นโปรแกรมที่เขียนด้วยภาษาไพธัน เกิดจากโครงการความร่วมมือสากล สำหรับใช้วิเคราะห์ข้อมูลชีวภาพที่สำคัญที่เกี่ยวกับลำดับ สามารถเลือกติดตั้งกับระบบปฏิบัติการวินโดวส์ แมคอินทอช ยูนีกซ์ ฯลฯ
คุณสมบัติของโปรแกรม
- สามารถใช้กับไฟล์ในฟอร์แมทที่แตกต่างกันมากมาย รวมทั้งไฟล์ผลลัพธ์จาก Blast, Clustalw, fasta, genbank, PubMed & Medline, ExPASy (เช่น Enzyme), Prodoc & Prosite, SCOP (รวมไฟล์ ‘dom’ และ ‘lin’), UniGene, SwissProt
- สามารถใช้ตรวจดูไฟล์แต่ละบันทึกในไฟล์ สามารถจัดไฟล์ลงดัชนี แล้วเข้าผ่านดิกชันนารีเชื่อมต่อ
- สามารถเข้าเว็บไซต์ชีวสารสนเทศ (NCBI – Blast, Entrez & PubMed, ExPASy – Prodoc & Prosite)
- สามารถเชื่อมต่อกับ โปรแกรมพื้นฐาน เช่น
- standalone blast ของ NCBI (Bio.Blast module. )
- Clustalw allignment program (Bio.Clustalw module)
- EMBOSS (Bio.EMBOSS module)
- Bill Pearson’s FASTA tools (Bio.AlignIO module)
- SIMCOAL2 and FDist tools สำหรับ population genetics (Bio.PopGen module)
- Wise2
- สามารถใช้กับลำดับชีวภาพต่างๆ ซึ่งรวมเลข ids และ features
- สามารถแปลรหัส ทรานสคริปชัน และคำนวณน้ำหนัก
- สามารถจัดกลุ่มข้อมูล ด้วย k Nearest Neighbors, Naive Bayes or Support Vector Machines
- สามารถใช้กับข้อมูล alignment รวมทั้ง การสร้าง/จัดการ ตาราง substitution matrices
- สามารถแยกงาน เป็นส่วนๆ (separate processes)
- ผสานรวมเข้ากับฐานข้อมูล BioSQL ซึ่งสามารถใช้ร่วมกับโปรแกรม BioPerl และ BioJava
- มีคู่มือและเอกสารประกอบ
การติดตั้งโปรแกรมไบโอไพธันและโปรแกรมที่จำเป็นบางอย่าง
แพ็คเกจไบโอไพธัน (Biopython) ใน Ubuntu804 เป็นเวอร์ชั่น 1.44 เมื่อต้องการติดตั้งเวอร์ชั่น 1.49 จึงต้องติดตั้งจาก source
- ดาวน์โหลดโปรแกรมจาก http://biopython.org/wiki/Download
(สำหรับวินโดวส์ จะเป็นไฟล์ที่ช่วยในการติดตั้งมีทั้งสำหรับโปรแกรมไพธัน เวอร์ชั่น 2.3, 2.4, และ 2.5 แต่ต้องติดตั้งโปรแกรมที่จำเป็นบางอย่างก่อน)
สำหรับลินุกซ์ เวอร์ชั่น 1.49 มี md5 ดังนี้ d233d4944f0c17d5927ca32c5a30d5b3 - ตรวจดูว่าในเครื่องมีโปรแกรมพื้นฐานที่ต้องการต่อไปนี้หรือไม่ ถ้าไม่มีต้องติดตั้งก่อน
- python ตั้งแต่เวอร์ชั่น 2.3 ขึ้นไป (ของผม 2.5)
- numeric-python (NumPy) ดาวน์โหลดได้จาก http://numpy.scipy.org/ สำหรับ numpy-1.2.1.tar.gz มี md5 ดังนี้ 1bc6dbddaf4b48ded8a619c6438fff37 และ sha1 ดังนี้ 1aa706e733aea18eaffa70d93c0105718acb66c5
- คำสั่งสำหรับติดตั้ง numpy-1.2.1 (tar -xzvpf numpy-1.2.1.tar.gz, cd numpy-1.2.1/, python setup.py build, python setup.py install)
- คำสั่งสำหรับติดตั้ง biopython-1.49 (tar -xzvpf biopython-1.49.tar.gz, cd biopython-1.49/, python setup.py build, python setup.py test, python setup.py install) หลังคำสั่ง python setup.py test ตรงจดูว่าทุกอย่างน่าจะขึ้นมา ok หมด
เอกสาร การติดตั้ง
1. ไฟล์ html ไปที่ http://biopython.org/DIST/docs/install/Installation.html
2. ไฟล์ pdf ไปที่ http://biopython.org/DIST/docs/install/Installation.pdf
ปัญหาการติดตั้งที่อาจพบ หลังคำสั่ง build
SystemError: Non-existing /usr/include/python2.5/Python.h. การแก้คือติดตั้ง ไฟล์ header ที่ต้องการโดยติดตั้ง python-dev อาจติดตั้งผ่าน package manager
การทดสอบหลังติดตั้ง
$ python
Python 2.5.2 (r252:60911, Jul 31 2008, 17:28:52)
[GCC 4.2.3 (Ubuntu 4.2.3-2ubuntu7)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> from Bio.Seq import Seq
>>> from Bio.Alphabet.IUPAC import unambiguous_dna
>>> new_seq = Seq('GATCAGAAG', unambiguous_dna)
>>> new_seq[0:2]
Seq('GA', IUPACUnambiguousDNA())
>>> from Bio import Translate
>>> translator = Translate.unambiguous_dna_by_name["Standard"]
>>> translator.translate(new_seq)
Seq('DQK', HasStopCodon(IUPACProtein(), '*'))
>>>
ถ้าได้ผลลัพธ์ (ส่วนที่เป็นสีแดง) แสดงว่าการติดตั้งดีแล้ว
การออกจากไพธัน พิมพ์ Ctrl + D
สวัสดีค่ะ