กลับมาเถิดที่รัก (Googlebot ในดวงใจ)


การใช้งานแบบหนึ่งที่ทำให้ระบบช้าลงคือการใช้ software ที่ "ดึง" เว็บทั้งหมดไปอ่าน offline โดยใช้โปรแกรม อาทิเช่น WebCopier เป็นต้น  โปรแกรมเหล่านี้จะทำการดึงหน้าเว็บต่างๆ โดยอัตโนมัติอย่างรวดเร็วเพื่อเก็บไว้ในเครื่องของผู้ใช้เพื่ออ่านในภายหลัง ช่วงที่ผู้ใช้ใช้โปรแกรม เหล่านี้ เครื่องแม่ข่ายก็จะเสมือนว่ามีผู้ใช้หลายๆ คนมาใช้พร้อมๆ กัน เนื่องจากเครื่องแม่ข่ายเราเป็นเพียงเครื่องระดับ desktop ธรรมดา เครื่อง เราจึงไม่สามารถรองรับการใช้ในลักษณะนี้ได้

เมื่อวันอาทิตย์ที่ผ่านมาผมได้เพิ่มความสามารถแบบหนึ่งใน KnowledgeVolution (ซึ่งยังบอกไม่ได้ เดี๋ยวรู้แกวหมด ก็กันไม่ได้พอดี) ที่จะทำให้โปรแกรมประเภท "ดึง" อย่างที่กล่าวไม่ สามารถทำงานได้กับ GotoKnow.org แต่ปรากฎว่าความสามารถนั้นทำงานได้ดีเกินไป โปรแกรมที่ "ดึง" หน้าเว็บไปเก็บที่เราอยากให้เขามา ดึงบ่อยๆ ได้แก่ Googlebot ก็โดนหางเลขไปด้วย ไม่มาดึงเว็บเราอีกเลยตั้งแต่วันอาทิตย์ที่ผ่านมา

บันทึกช่วงหลังๆ นี้จึงยังค้นหากับ Google ไม่เจอครับ แต่ถ้า Google กลับมาเมื่อไหร่ก็จะค้นหาเจอทันทีครับ

ตอนนี้ผมเอาความสามารถในการป้องกันนั้นออกแล้ว แล้วก็นั่งคอยเฝ้าคอยดูใน log file ว่าเมื่อไหร่ Googlebot จะกลับมาเสียทีนะ

เหมือนชายหนุ่มนั่งคอยหญิงสาวที่เขาเผลอเรอทำให้เธอโกรธงอน

โถ... กลับมาเถิดที่รัก Googlebot ของพี่

คำสำคัญ (Tags): #knowledgevolution#bug#crawler#web#google
หมายเลขบันทึก: 37054เขียนเมื่อ 4 กรกฎาคม 2006 17:04 น. ()แก้ไขเมื่อ 15 เมษายน 2012 01:26 น. ()สัญญาอนุญาต: สงวนสิทธิ์ทุกประการจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (7)

ลึกซึ้งครับ และถูกต้องตามใน Flash file จริงๆ ด้วย

ยิ่งกว่านั้น อ.ขจิต ส่งมาถูกคนมากเลยครับ เพราะวันที่ 10 ก.ย. 2001 ผมอยู่ที่ New York ครับ และกลับ Baltimore ในคืนนั้น จริงๆ แล้วกะจะอยู่ต่ออีกวันเพื่อขึ้น World Trade Center ตอนเช้าก่อนกลับด้วยซ้ำ แต่ตัดสินใจไม่อยู่ เรื่องนี้เรื่องยาว ไว้มีโอกาสผมเขียนบันทึกเล่าเหตุการณ์ดีกว่าครับ

Googlebot มาแล้วครับ ดีใจจัง Google ไม่งอนแล้ว

แหม อยากอ่านเรื่องเฉียดฉิวของอ.ธวัชชัยมากค่ะ พวกเราช่วยกันออกเสียงเรียกร้องหน่อยเถอะ เคยได้ยินแต่เรื่องเล่า"near miss"จากฝรั่ง  ยังไม่เคยได้ยินของคนไทยเลยค่ะ ขอหน่อย ขอหน่อย

มีโอกาสเมื่อไหร่จะเขียนบันทึกเล่าแน่นอนครับพี่โอ๋ เรื่องนี้คลาดไปแค่เจ็ดชั่วโมงเท่านั้นเองครับ ไม่งั้นได้ไปนอนแถว ground zero แล้ว

แล้วยังงี้จะมีวิธีแก้ไขยังไงครับ

คือการมาของ ก.ก.บ. มันจะต่างกะพวกโปรแกรมดูดเว็บยังไงเอ่ย?

พอมีวิธีแก้อยู่ครับ กำลังทดลองอยู่ ถ้าได้ผลก็จะเปิดเผยให้ทราบกันต่อไปครับ

อนุญาตให้แสดงความเห็นได้เฉพาะสมาชิก
พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท