บันทึกนี้เกี่ยวกับ การแนะนำไบโอไพธัน การติดตั้งและทดสอบเวอร์ชั่น 1.49 จาก source

โปรแกรมไบโอไพธัน เป็นโปรแกรมที่เขียนด้วยภาษาไพธัน เกิดจากโครงการความร่วมมือสากล สำหรับใช้วิเคราะห์ข้อมูลชีวภาพที่สำคัญที่เกี่ยวกับลำดับ สามารถเลือกติดตั้งกับระบบปฏิบัติการวินโดวส์ แมคอินทอช ยูนีกซ์ ฯลฯ

                                    คุณสมบัติของโปรแกรม

  • สามารถใช้กับไฟล์ในฟอร์แมทที่แตกต่างกันมากมาย รวมทั้งไฟล์ผลลัพธ์จาก Blast, Clustalw, fasta, genbank, PubMed & Medline, ExPASy (เช่น Enzyme), Prodoc & Prosite, SCOP (รวมไฟล์ ‘dom’ และ ‘lin’), UniGene, SwissProt 
  • สามารถใช้ตรวจดูไฟล์แต่ละบันทึกในไฟล์ สามารถจัดไฟล์ลงดัชนี แล้วเข้าผ่านดิกชันนารีเชื่อมต่อ
  • สามารถเข้าเว็บไซต์ชีวสารสนเทศ (NCBI – Blast, Entrez & PubMed, ExPASy – Prodoc & Prosite) 
  • สามารถเชื่อมต่อกับ โปรแกรมพื้นฐาน เช่น
    • standalone blast ของ NCBI (Bio.Blast module. )
    • Clustalw allignment program (Bio.Clustalw module)
    • EMBOSS (Bio.EMBOSS module)
    • Bill Pearson’s FASTA tools (Bio.AlignIO module)
    • SIMCOAL2 and FDist tools สำหรับ population genetics (Bio.PopGen module)
    • Wise2 
  • สามารถใช้กับลำดับชีวภาพต่างๆ ซึ่งรวมเลข ids และ features
  • สามารถแปลรหัส ทรานสคริปชัน และคำนวณน้ำหนัก
  • สามารถจัดกลุ่มข้อมูล ด้วย k Nearest Neighbors, Naive Bayes or Support Vector Machines
  • สามารถใช้กับข้อมูล alignment รวมทั้ง การสร้าง/จัดการ ตาราง substitution matrices
  • สามารถแยกงาน เป็นส่วนๆ (separate processes)
  • ผสานรวมเข้ากับฐานข้อมูล BioSQL ซึ่งสามารถใช้ร่วมกับโปรแกรม BioPerl และ BioJava 
  • มีคู่มือและเอกสารประกอบ

 

                       การติดตั้งโปรแกรมไบโอไพธันและโปรแกรมที่จำเป็นบางอย่าง

แพ็คเกจไบโอไพธัน (Biopython) ใน Ubuntu804 เป็นเวอร์ชั่น 1.44 เมื่อต้องการติดตั้งเวอร์ชั่น 1.49 จึงต้องติดตั้งจาก source

  1. ดาวน์โหลดโปรแกรมจาก http://biopython.org/wiki/Download
    (สำหรับวินโดวส์ จะเป็นไฟล์ที่ช่วยในการติดตั้งมีทั้งสำหรับโปรแกรมไพธัน เวอร์ชั่น 2.3, 2.4, และ 2.5 แต่ต้องติดตั้งโปรแกรมที่จำเป็นบางอย่างก่อน)
    สำหรับลินุกซ์ เวอร์ชั่น 1.49 มี md5 ดังนี้ d233d4944f0c17d5927ca32c5a30d5b3
  2. ตรวจดูว่าในเครื่องมีโปรแกรมพื้นฐานที่ต้องการต่อไปนี้หรือไม่ ถ้าไม่มีต้องติดตั้งก่อน
    1. python ตั้งแต่เวอร์ชั่น 2.3 ขึ้นไป (ของผม 2.5)
    2. numeric-python (NumPy) ดาวน์โหลดได้จาก  http://numpy.scipy.org/ สำหรับ numpy-1.2.1.tar.gz มี md5 ดังนี้ 1bc6dbddaf4b48ded8a619c6438fff37 และ sha1 ดังนี้ 1aa706e733aea18eaffa70d93c0105718acb66c5
  3. คำสั่งสำหรับติดตั้ง numpy-1.2.1 (tar -xzvpf numpy-1.2.1.tar.gz, cd numpy-1.2.1/, python setup.py build, python setup.py install)
  4. คำสั่งสำหรับติดตั้ง biopython-1.49 (tar -xzvpf biopython-1.49.tar.gz, cd biopython-1.49/, python setup.py build, python setup.py test, python setup.py install) หลังคำสั่ง python setup.py test ตรงจดูว่าทุกอย่างน่าจะขึ้นมา ok หมด
เอกสาร การติดตั้ง
1. ไฟล์ html ไปที่ http://biopython.org/DIST/docs/install/Installation.html
2. ไฟล์ pdf ไปที่ http://biopython.org/DIST/docs/install/Installation.pdf
ปัญหาการติดตั้งที่อาจพบ หลังคำสั่ง build
SystemError: Non-existing /usr/include/python2.5/Python.h. การแก้คือติดตั้ง ไฟล์ header ที่ต้องการโดยติดตั้ง python-dev อาจติดตั้งผ่าน package manager

                              การทดสอบหลังติดตั้ง

$ python

Python 2.5.2 (r252:60911, Jul 31 2008, 17:28:52)
[GCC 4.2.3 (Ubuntu 4.2.3-2ubuntu7)] on linux2
Type "help", "copyright", "credits" or "license" for more information.

>>> from Bio.Seq import Seq
>>> from Bio.Alphabet.IUPAC import unambiguous_dna
>>> new_seq = Seq('GATCAGAAG', unambiguous_dna)
>>> new_seq[0:2]
Seq('GA', IUPACUnambiguousDNA())
>>> from Bio import Translate
>>> translator = Translate.unambiguous_dna_by_name["Standard"]
>>> translator.translate(new_seq)
Seq('DQK', HasStopCodon(IUPACProtein(), '*'))
>>>

ถ้าได้ผลลัพธ์ (ส่วนที่เป็นสีแดง) แสดงว่าการติดตั้งดีแล้ว

การออกจากไพธัน พิมพ์ Ctrl + D