User Socialization ระดับไหนเหมาะกับ GotoKnow ?

เห็นด้วยกับที่คุณหมอวัลลภว่าไว้ครับ
มีวิธีที่ดีว่านี้มากหลายวิธีครับ แต่วิธีที่ว่ามานี้ น่าจะเป็นวิธีที่เขียนโค้ดง่ายสุด และทำงานได้เร็วพอสมควร ซึ่งจะทำให้สามารถปรับย่อยได้โดยไม่ต้องรอยกเครื่อง version ใหม่หมด ถือเป็นวิธีที่น่าจะเล็กจิ๋วที่สุดในตระกูล
ที่ผมกล้าเสนอขึ้นมา เพราะเชื่อว่ามันเล็กจิ๋วที่สุดนี่แหละครับ แม้แต่วิธีนี้ ผมก็ยังเกรงว่าจะทำให้ระบบช้าอืด
ในระยะยาว ไม่ว่าจะใช้วิธีไหน คงต้องมี server แยกไปอีกตัวเพื่อคำนวณ
ทำไมอืด ? เพราะเวลาที่ใช้คำนวณน่าจะจะแปรผันตรงกับจำนวน blog ยกกำลังสอง
สำหรับผู้ไม่มีพื้นฐาน ข้อพิสูจน์ ดูจาก Pseudocode ได้

1. List all tags in GotoKnow universe and save in [A]

2. For each blog, count frequency of all elements in [A] and normalize to such that the sum of all normalized frequency is 1

3. Pairing blogs and compute cosine coefficient of both blogs (ตรงนี้ชี้ให้เห็นว่าเป็นปัญหาแบบจำนวน blog ยกกำลังสอง)

แต่้เนื่องจากจำนวน blog เองก็โตเป็น exponential function ของเวลา เช่น ถ้าอัตราการเติบโตเป็นร้อยละ k ต่อปี ดังนั้น เวลาที่ใช้ในการคำนวณ socialization ก็จะช้าลง (ใช้เวลามากขึ้น) ด้วยอัตราร้อยละ 2k ต่อปี
ดังนั้น ไม่ว่าใช้วิธีไหนที่ตรงไปตรงมา จะคาดการได้ว่า ยิ่งนานไป ระบบจะยิ่งช้าลงเรื่อย ๆ แน่นอน เพราะ blog เพิ่มขึ้นเรื่อย ๆ ทุกวัน
เนื่องจาก blog ใน GotoKnow โตประมาณปีละ 8.5 เท่า (ผมประมาณจากหมายเลข blog ที่เขียนปีที่แล้วในช่วงเวลาเดียวกันเป็นฐาน และเทียบกับ blog ล่าสุดว่ามีหมายเลขเท่าไหร่)
หรือนั่นคือ GotoKnow โต 18 % ต่อเดือน !
ตัวเลขนี้น่าตกใจ เพราะ GotoKnow โตด้วยอัตราเร็วที่แซงหน้าการค้นพบทาง biology ที่ถือกันว่าโตเร็วที่สุดในโลกเสียอีก (ซึ่งอยู่ที่ 11 % ต่อเดือนโดยประมาณ)
การทำ socialization จึงเป็นงานที่โหดมากในการ optimize code เพราะจะเสี่ยงต่อการที่เวลาใช้เพื่อคำนวณแต่ละรอบ จะโตเร็วเป็นสองเท่า (36 % ต่อเดือน)
คงต้องหาทุนตั้ง server รอแล้วกระมังครับ ?

wwibul

User Socialization ระดับไหนเหมาะกับ GotoKnow ?

ความเห็น (7)

ดร. จันทวรรณ ปิยะวัฒน์

เมตตา

wwibul

ดร. ธวัชชัย ปิยะวัฒน์

นพ. วัลลภ พรเรืองวงศ์

ดร. จันทวรรณ ปิยะวัฒน์

wwibul