Microsoft Office Open XML Format

@RT
"ครั้งแรกกับมาตรฐานเปิดของ Microsoft Office"

พอดีเมื่อหลายอาิิทิตย์ก่อนผมได้มีโอกาสไปฟังคนของ Microsoft บรรยายเรื่องฟอร์แมตเอกสารใหม่ที่จะเป็นมาตรฐานของ Microsoft Office 2007 ที่กำลังจะออกในเร็วๆ นี้ ซึ่งเรียกว่า Microsoft Office Open XML ซึ่งจะต่างไปจากเดิมตรงที่ ข้อมูลจะถูกเก็บอยู่ในรูปแบบของ XML หลายๆ คนอาจจะทราบแล้ว แต่อาจจะเพียงแค่ผิวเผินว่ามันเก็บเป็น XML อย่างไร วันนี้ผมเลยอยากจะมาเพิ่มเติมให้ทุกคนได้รู้กันครับ

โดยคร่าวๆ คือ ฟอร์แมตของ word, excel, และ powerpoint จากเดิมที่เป็น .doc, .xls, .ppt นั้นก็จะเปลี่ยนเป็น .docx, .xlsx และ .pptx ตามลำดับ สำหรับฟอร์แมตใหม่ที่เป็น Open XML

เมื่อก่อนผมก็งงเหมือนกันว่ามันเก็บเป็น XML ยังไงพอเราลองใช้ notepad เปิดมันก็เป็นตัวยึกยืออ่านไม่รู้เรื่อง  ความจริงแล้วไฟล์พวกนี้มันอยู่ในฟอร์แมต zip ครับ สังเกตว่าถ้าเราลองลากไฟล์มาเปิดด้วย winzip หรือ winrar เป็นต้น ก็จะเห็นว่าข้างในนั้น เป็นไฟล์ XML จำนวนมากนั่นเอง

 

เพื่อให้เห็นภาพมากขึ้น ผมจะลองใช้ Microsoft Word 2007 สร้างเอกสารขึ้นมา ดังรูป มีตัวหนังสือ และผมแทรกรูปภาพ 1 รูปเป็นไฟล์ png แล้ว save เป็น hello.docx

 เมื่อใช้ WinRAR เปิดดูจะเห็นว่ามันเป็น zip ไฟล์จริงๆ ครับ และมีการจัดรูปแบบไว้อย่างแน่นอนกำหนดโดย Ecma ภายใต้ผู้สนันสนุนหลายราย เช่น Apple, British Library, Canon, Intel, Microsoft, NextPage, Novell, Pioneer เป็นต้น

ส่วนของโครงสร้างนั้น ผมไม่่ค่อยจะรู้รายละเอียดเท่าไหร่นัก รู้เพียงว่ามันจะแบ่งส่วนๆ แยกกัน เช่น ส่วนข้อมูล ส่วนการจัดฟอร์แมต ส่วน metadata เป็นต้น ถ้าเราลองเข้ามาดูใน folder word จะเห็นดังรูปข้างล่าง

ที่น่าสนใจอย่างหนึ่งคือ รูปภาพที่เราใส่เข้าไป ก็ยังคงเก็บเป็นไฟล์รูปภาพธรรมดาครับ ดังที่เห็นข้างล่าง

 หลายคนคงสงสัยว่า แล้วพอเปลี่ยนเป็น ฟอร์แมตเปิดแบบ XML แล้วมันดีกว่าเก่าอย่างไร ที่สำคัญก็คือ เราสามารถสร้างโปรแกรมของเราเอง ที่จะสร้างเอกสาร อ่าน หรือแก้ไข ได้โดยง่ายขึ้นมาก เช่น ถ้าเราลองดูที่ไฟล์ document.xml จะเห็นว่าเป็นไฟล์ที่เก็บตัวหนังสือที่อยู่ในเอกสารของเรา จะเห็นว่ามีคำว่า Hello, everyone ที่เราพิมพ์ไว้

ผมจะลองแก้เป็น Hello World! ดูแล้ว เซฟกลับเข้าไปแล้วเปิดด้วย Word 2007 ใหม่ สังเกตครับ

นั่นแสดงว่า เราสามารถแก้ไข หรือแม้แต่สร้าง เอกสาร โดยไม่ต้องมี Microsoft Word!!! เห็นประโยชน์กันยังครับ

สุดท้ายนี้ ต้องให้ข้อมูลหน่อยครับว่าไม่ได้มีเฉพาะทาง ฝั่ง Microsoft ทางเดียวที่เก็บข้อมูลเอกสารเป็นแบบ XML ทางฝั่งของ OpenOffice ก็มีฟอร์แมต OpenDocument เช่นกัน ซึ่งทำมาก่อน OpenXML ของ Microsoft ด้วยซ้ำ (ไม่รู้ทำไมไม่ใ้ช้อันเดียวกันเลย) เหตุผลหนึ่งที่ Microsoft ไม่ใช้ OpenDocument และสร้างฟอร์แมตของตัวเองขึ้นมานั้น คิดว่าเป็นเพราะ ต้องการทำให้แปลงกลับไปเป็นเอกสารเวอร์ชันเก่าๆ ของ office ได้ และรวมถึงการมี macro, VBA ในเอกสารด้วย

มีการวิพากวิจารณ์ ถึงข้อดี ข้อเสียของฟอร์แมตทั้งสองแบบ สามารถอ่านได้จาก Wikipedia

ที่มา - การบรรยายที่ Microsoft, Wikipedia  

บันทึกนี้เขียนที่ GotoKnow โดย  ใน บล็อกโดย @RT

คำสำคัญ (Tags)#openxml#office2007

หมายเลขบันทึก: 60793, เขียน: 18 Nov 2006 @ 11:01 (), แก้ไข: 06 Sep 2013 @ 17:38 (), สัญญาอนุญาต: สงวนสิทธิ์ทุกประการ, ความเห็น: 7, อ่าน: คลิก


ความเห็น (7)

น่าสนใจค่ะ

น่าจะบอกว่าสามารถเขียนโปรแกรมให้ไปจัดการเอกสาร office ได้ดีขึ้นกว่าจากเดิมที่เป็น binary file ดีมั้ย @RT
ว่าแต่ @RT ได้ลง office 2007 แล้วรึป่าว อิอิ

ขอบคุณค่ะสำหรับความรู้เรื่อง Microsoft Office Open XML Format  น่าสนใจมากค่ะ  อ ได้ลง office 2007แล้วรู้สึกชอบดีค่ะ  ใช้ง่ายและสวยงามมากขึ้น

 

Rin
เขียนเมื่อ 
น่าสนใจดีนะคะ แต่ก็ยังมองข้อดีข้อเสียยังไม่ค่อยออกเท่าไหร่ ถ้ามีโอกาสจะลองศึกษาดูแน่นอนค่ะ..
ขอบคุณมากมายครับ@RT แต่ขอยืมแผ่น Office2007 มาลงหน่อยจิ ตอนนี้ใช้OpenOffice
belive
IP: xxx.121.30.191
เขียนเมื่อ 

เนื่องจากการเก็บไฟล์เป็น XML Format นั้นไม่สามารถนำไปเปิดกับ office ver. 97-2003 ได้ และวารสารวิชาการชื่อดังดังอย่าง Science และ Nature ประกาศในเว็บไซต์ของตัวเองว่า ไม่รับบทความวิชาการในรูปแบบ .docx ที่สร้างด้วย Word 2007
ทาง Science บอกว่าให้แปลงกลับมาเป็น .doc ของ Word 2003 แทนก่อนส่ง แต่ถ้ามีสมการคณิตศาสตร์แล้วล่ะก็ Science จะไม่รับเลย เพราะตัวแปลงฟอร์แมตของ Word 2007 จะแปลงสมการออกมาเป็นภาพ ซึ่งไม่สามารถนำไปตีพิมพ์ได้สะดวก แต่ข้อดีก็คือมันจะประหยัดเนื้อในในการเก็บข้อมูลเพราะไฟล์ที่ได้นั้นจะมีขนาดเล็กลงกว่าเดิม