อนุทิน #14210

เขียนโปรแกรม extract feed เพื่อทำ index

ปัญหา

  • feed ของ gotoknow ไม่สามารถใช้ default SaxParser parse ได้ เพราะมี entity   เลยเปลี่ยนไปใช้ ROME parse (ผ่าน JDom), ซึ่งก็มีข้อดีตรงเจ้าตัว ROME มันเป็น generic feed parser ที่ pass ได้หลากหลาย version
  • feed ของ blognone มี html code ปนอยู่ด้วย ก็เลยต้อง remove ทิ้ง ก่อนส่งเข้าไปทำ index
เขียน:

ความเห็น (0)