ใน IT อะไรโตเร็วสุด ?


IT เป็นแขนงที่โตเร็วมาก

การเติบโตมักจะเป็น exponential function ของเวลา

นั่นคือ ทวีคูณในช่วงเวลาที่คงที่ค่าหนึ่ง

ส่วนที่โตช้าที่สุด ดูเหมือนจะเป็น software เพราะไม่ค่อยมีตัวเลขที่น่าตื่นเต้นอะไรออกมา แม้ว่าจะพอรู้กันว่าโตแบบ exponential ก็ตาม

แต่ที่เกี่ยวกับฮาร์ดแวร์ ตัวเลขนี่น่าทึ่งครับ

เวลาที่ใช้สำหรับการโตแบบทวีคูณด้านฮาร์ดแวร์ มีคนเก็บสถิติมากมาย ที่เก็บรวบรวมไว้แบบลึกซึ้งน่าคิดต่อ ก็มีนักสร้างระบบปัญญาประดิษฐ์ชื่อ Ray Kurzweil นำเสนอไว้ในเว็บ The Singularity Is Near (และมีฉบับหนังสือด้วย) ที่ http://www.kurzweilai.net (เรื่องงานเขียนของเรย์นี่น่าพูดถึงต่อครับ แล้วจะค่อยหาโอกาสเหมาะ ๆ เขียนถึง เพราะเรย์ฟันธงว่า จริง ๆ แล้ว การเติบโตด้าน IT เป็นแบบ exponential ซ้อน exponential อีกที ซึ่งจะทำให้ตัวเลขที่เราคาดการณ์ตอนนี้ จะต่ำกว่าความเป็นจริงที่จะเกิดขึ้นเสมอ (ซึ่งข้อมูลจริงที่ผ่านมือผมเรื่อง spam ข้างท้ายนี่ ก็สอดคล้องกับแนวคิด double exponential นี้มาก)

ตัวอย่างเช่น ฮาร์ดดิสก์ จุเท่าตัวทุกเก้าเดือน

ซีพียูเร็วเท่าตัวทุกปี (กฎของมัวร์รุ่นปรับแก้)

แต่ตัวเลขการเติบโตของ content ก็ไม่น้อยหน้า

เช่น ข้อมูลสาขาที่ร้อนแรงที่สุดทางวิทยาศาสตร์คือ bioinformatic โตเร็วเท่าตัวทุก 6 เดือน แซงหน้าสาขาอื่นด้านวิทยาศาสตร์ไปหมด

สถิติของ GotoKnow  น่าประทับใจกว่านั้นอีก แต่เนื่องจากเป็นช่วงเวลาที่สั้นมาก ก็ยังไม่แน่ว่าจะเป็นแบบนี้ต่อไปนานแค่ไหน นั่นคือ โตเท่าตัวราวทุก 3 เดือนครึ่ง (คิดละเอียดหน่อย จะเป็น 10.7 เท่าต่อปี) ถือเป็นตัวแทนที่เชิดหน้าชูตาฐานข้อมูลที่เน้นมิติทางสังคมศาสตร์ ว่าก็โตได้ร้อนแรงไม่แพ้กัน

แม้ GotoKnow จะแตกตัวออกไปเป็น web การศึกษา ก็เป็นเพียงการลดค่าจำนวนฐานตั้งต้นในปัจจุบันเท่านั้น แต่ไม่ควรมีผลกระทบกับอัตราการเติบโต หรือนั่นคือ เราจะเห็นปรากฎการณ์เหมือนยอดผู้ใช้ GotoKnow พักร้อนไปครึ่งปี ก่อนจะโตต่อจากวันก่อนหน้าการแตกเครือ (การทำนายต่าง ๆ ก็จะผิดไปครึ่งปี เช่น จำนวน blog 1 ล้าน blog ก็คงไปถึงตอนกลางปี 2552 เป็นอย่างช้า

หมายเหตุสำหรับผู้สนใจ: ที่มาของตัวเลข

ผมสุ่ม blog มาราว 4-5 ิblog ที่มีอายุต่าง ๆ กัน ดูหมายเลข blog และดูวันที่ แปลงข้อมูลวันที่ของ blog ที่เ้ก่าสุดที่สุ่มมาเป็นวันที่ 0 (เรียก blog 0) แล้ว blog ที่ใหม่กว่านั้นก็จะดูว่าต่างกับ blog 0 ไปกี่วัน แล้วทำ regression ระหว่างแกนนอนเป็น ความแตกต่างหน่วยเป็นวัน และแกนยืนเป็น ln(หมายเลข blog) ค่า slope ที่ได้ จะเป็นค่าคงที่การเติบโตแบบ exponential ต่อวัน ซึ่งคูณเลขนี้ด้วย 365 ก็จะได้ค่าคงที่หน่วยต่อปี แล้วหาค่า e ยกกำลังค่าคงที่นี้ ก็จะได้ตัวเลขว่าโตเป็นกี่เท่าต่อปี

ถ้าดึงข้อมูลของทุก blog ทั้งหมดมาได้ ก็ควรจะได้ค่าที่แม่นยำกว่านี้ แต่ผมไม่คิดว่าจะต่างกันมากนัก

แต่ที่โตเร็วที่สุดแบบชวนหักมุม กลับเป็น spam ขยะครับ

สถิติ spam ของ webboard บริการวิชาการตอบคำถามเรื่องยา (drug.pharmacy.psu.ac.th) ที่ผมต้องดูแลลบทุกวันนี้ ก็ปรากฎว่า spam โตแบบ double exponential เหมือนกัน (ทวีคูณในช่วงระยะเวลาที่สั้นลงเรื่อย ๆ)

 Spam is double exponential

ดูง่าย ๆ ว่าเป็น double exponential หรือไม่ ก็คือ plot กราฟโดยแกนยืนใช้ log scale

ถ้าเป็นการเติบโตแบบ exponential ตามปรกติ เราจะเห็นเป็นเส้นตรง

แต่ถ้าเป้นการเติบโตแบบ double exponential เราจะเห็นการโค้งแบบที่เห็นข้างบนนี้ 

เป็นข้อพิสูจน์ที่ไม่มีข้อสงสัยอีกแล้วครับ ว่าพลังการทำลายล้างของคนโรคจิต โตเร็วที่สุดในโลก

 

หมายเลขบันทึก: 63424เขียนเมื่อ 26 พฤศจิกายน 2006 22:27 น. ()แก้ไขเมื่อ 6 กันยายน 2013 17:39 น. ()สัญญาอนุญาต: จำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (4)
  • ขอบคุณมากครับ
  • ได้ความรู้ดีครับ
  • เพิ่งทราบว่า gotoknow โตมากเลยครับ

ขอขอบคุณอาจารย์ wwibul...

  • ... (นึก comment ไม่ออก) ...

อีก 1 ปีจากนี้ ถ้าการเติบโตชะลอตัวลงมา เช่น 5 เท่า เราจะเห็นมี blog ราว 3 แสนกว่า blog

หากไม่ชะลอตัว อาจเห็น 6 แสน blog ราวสิ้นปี 2550

แต่สิ้นปี 2551 มีสิทธิเห็นล้าน blog !

ไม่รู้ server จะรับมือไหวหรือเปล่า เมื่อถึงเวลานั้น...

เป็นห่วงนิดหน่อย... พอสังเขป ฯ

ที่ไม่ห่วงมาก เพราะเรื่องนี้แก้ปัญหาได้ด้วยเงินครับ

 

จริงๆ ครับ เรื่องการรองรับการเติบโตนั้นไม่ต้องห่วงจริงๆ ครับ เพราะแก้ได้ด้วยเงินครับ ระบบเราออกแบบมาเป็น distributed environment ซื้อเครื่องมาเพ่ิมระบบเราก็เร็วขึ้นได้ทันทีครับ
พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท