อนุทิน 30864


wwibul
เขียนเมื่อ

@30858 เห็นด้วยครับ

มีข้อเสนอว่า อิงจากข้อมูลการใช้จริงในอดีต คือ ดูความยาวข้อมูลเก่าทั้ง Nรายการ เรียงจากมากไปน้อย แล้วดูว่าข้อมูลบรรทัดที่ N/1000 มีค่าเท่าไหร่ (=99.9 % upperbound level) ก็ใช้ค่านั้นมากำหนดเป็นความกว้างของฟิลด์ข้อมูล เป็นการหา upperbound level จากการใช้งานจริงในอดีต

หั่นแบบนี้ เท่ากับกรองทิ้งรายการที่ยาวสุดโต่งให้ แต่คำถามคือ รายการที่ post ไปแล้ว จะทำอย่างไร ? (อาจมีกลไกการเก็บเป็น archive ไว้ชั่วคราวให้)

หากมองว่า 99.9 % ยังไม่เหมาะ จะลองเลขอื่นก็ได้ เช่น 99.99%

ใช้วิธีนี้ จะเป็นธรรมชาติกว่าการกำหนดเลขกลม ซึ่งมีโอกาสสูงไปหรือต่ำไป

ถ้าเลขกลมสูงไป ก็เท่ากับไม่มีประโยชน์ที่จะทำ

ถ้าเลขกลมต่ำไป ก็เท่ากับเป็นการฝืนความเคยชินของสมาชิกที่ใช้ตามปรกติมากไป

การใช้ 99.9 % upperbound level เป็นการอิงตามการใช้งานจริงในอดีต ที่แน่ใจได้ว่า มีโอกาสเพียง 1 ในพันที่จะ post แล้วไม่สบอารมณ์

หรืออีกทางเลือกหนึ่ง ใช้ข้อมูลเก่ามาเรียงจากความยาวมากสุดไปน้อยสุด แล้วดูว่า ลองตัดดูทีละบันทึกไล่ลงไปจนถึงรายการที่ไม่ควรตัดเลย (อิงความเชื่อว่า บันทึกที่ยาวที่สุด ยาวโดยไม่เหมาะสม) เจอตรงบรรทัดไหน บรรทัดนั้นคือความยาวสูงสุดที่ควรตั้งไว้เป็น default แบบนี้ จะทำให้ไม่ต้องมีเรื่องวุ่นตามหลัง

หรือจะใช้วิธีหักดิบ กำหนดให้สั้นมากไปเลย ก็สะดวกดี แต่เชื่อว่า "วงแตก"



ความเห็น (0)

ไม่มีความเห็น

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท