Data Fusion หรือ การหลอมรวมข้อมูล เป็นรูปแบบวิธีการหรือเครื่องมือในการนำเอาข้อมูลการสำรวจจากระยะไกลที่มาจากแหล่งกำเนิดที่ต่างกัน (different sources) และมีลักษณะหลากหลาย (multi) มารวมกัน เพื่อสร้างเป็นข้อมูลใหม่หรือเพื่อให้ได้ข้อมูลตัวแทน (representative data)
Data Fusion หรือ การหลอมรวมข้อมูล เป็นรูปแบบวิธีการหรือเครื่องมือในการนำเอาข้อมูลการสำรวจจากระยะไกลที่มาจากแหล่งกำเนิดที่ต่างกัน (different sources) และมีลักษณะหลากหลาย (multi) มารวมกัน เพื่อสร้างเป็นข้อมูลใหม่หรือเพื่อให้ได้ข้อมูลตัวแทน (representative data) โดยมีจุดประสงค์หลักเพื่อปรับปรุงคุณภาพข้อมูลให้มีคุณภาพดีขึ้น ตรงตามวัตถุประสงค์การใช้งาน เพิ่มมุมมองของข้อมูลหลากหลายมากยิ่งขึ้น อันจะเป็นประโยชน์ต่อการนำข้อมูลดังกล่าวไปใช้งาน เช่น ช่วยเพิ่มความถูกต้องของการจำแนกการใช้ประโยชน์ที่ดินและสิ่งปกคลุมดิน ช่วยเพิ่มรายละเอียดหรือความชัดเจนในการจำแนกวัตถุ เป็นต้น ทั้งนี้มีคำศัพท์หลายคำที่ถูกนำมาใช้แทนหรือมีความหลายใกล้เคียงกันในศาสตร์นี้ เช่น คำว่า merging, combination, synergy หรือ integration
 
วิธีการในการหลอมรวมข้อมูลนั้นสามารถทำได้หลากหลายรูปแบบ เช่น การเพิ่มความละเอียดเชิงพื้นที่ด้วยวิธีการทำ Pan Sharpening หรือ Resolution merge ซึ่งเป็นเทคนิคในการประมวลผลภาพข้อมูลดาวเทียมโดยการนำเอาภาพข้อมูลดาวเทียมในระบบหลายช่วงคลื่น (multi spectral) ที่มีรายละเอียดเชิงคลื่นสูง มาผสมรวมกับภาพข้อมูลดาวเทียมในระบบขาวดำที่มีรายละเอียดเชิงพื้นที่สูง เพื่อผลิตภาพข้อมูลดาวเทียมสังเคราะห์ที่มีรายละเอียดเชิงคลื่นและเชิงพื้นที่สูงมารวมไว้ในภาพเดียว โดยวิธีการนี้จะรักษาข้อมูลรายละเอียดเชิงคลื่นของภาพข้อมูลดาวเทียมในระบบหลายช่วงคลื่น ในขณะเดียวกันก็เป็นการเพิ่มรายละเอียดเชิงพื้นที่ให้กับภาพข้อมูลดาวเทียมด้วย ยกตัวอย่าง ได้แก่ นำภาพ SPOT-XS (3 bands, 20 m) มาทำ Pan Sharpening กับ SPOT-P (panchromatic, 10 m) ทำให้ได้ภาพ multi spectral ที่มีความละเอียด 10 เมตร หรือ นำภาพ IKONOS (4 multispectral bands, 4 m) มาทำ Pan Sharpening กับ PAN (panchromatic, 1 m) เพื่อให้ได้ภาพ multi spectral ที่มีความละเอียด 1 เมตร เป็นต้น นอกจากนี้การหลอมรวมข้อมูลยังทำได้อีกหลายแบบ เช่น lidar-multispectral stack, optical-SAR stack, RGB Color Composite, Brovey Transformation, IHS Transformation, Principal Component Analysis (PCA), Wavelet Transformation และ Ehler Fusion เป็นต้น
 
โดยปัจจัยสนับสนุนความหลากหลายของการหลอมรวมข้อมูล คือ การพัฒนาด้านการสำรวจระยะไกล จำนวนดาวเทียมสำรวจทรัพยากรที่เพิ่มมากขึ้น ความหลากหลายของ sensor ที่ใช้ในการตรวจวัด และความละเอียดในการตรวจวัด ทั้ง spatial resolution, spectral resolution, radiometric resolution และ temporal resolution รวมไปถึงวัตถุประสงค์ และความต้องการการใช้งานจากข้อมูลการสำรวจระยะไกลที่มีอยู่อย่างหลากหลาย ทั้งในปัจจุบันและแนวโน้มเพิ่มมากขึ้นในอนาคต
 
ดังที่กล่าวในเบื้องต้นว่าแนวคิดหลักของการหลอมรวมข้อมูลเป็นการรวมข้อมูลที่มีลักษณะ “Multi” เข้าด้วยกัน โดยหลักการดังกล่าวอ้างถึงลักษณะความหลากหลายดังต่อไปนี้คือ multi-spectral หรือ multi-frequency, multi-temporal, multi-polarization, multi-sensor image analysis, multi-scale และ other sources of spatial data โดยที่
  1. ความหลากหลายเชิงคลื่นหรือความถี่ (multi-spectral/multi-frequency) เป็นลักษณะความหลากหลายของช่วงความยาวคลื่นหรือจำนวนแบนด์และความถี่จากการตรวจวัดค่าการสะท้อนหรือกระจัดกระจายกลับของคลื่น EM โดยวัตถุแต่ละประเภทจะมีลายเซ็นเชิงคลื่น (spectral signature) ที่แตกต่างกัน เครื่องตรวจวัดแต่ละอย่างมีจำนวนแบนด์ที่แตกต่างกัน ทั้งในลักษณะของ multi spectral ซึ่งมีจำนวนแบนด์น้อย เช่น Ikonos และ Quickbird และลักษณะของ hyperspectral ซึ่งมีจำนวนมากกว่า 100-200 แบนด์ เช่น Hyperion
  2. ความหลากหลายเชิงเวลา (multi-temporal) เป็นลักษณะของคาบการบันทึกซ้ำของดาวเทียม ซึ่งมีผลต่อการลักษณะและความแตกต่างของวัตถุหรือสิ่งปกคลุมดินในแต่ละช่วงเวลา นอกจากนี้ยังให้ข้อมูลค่าการสะท้อนของพื้นที่ภายใต้เงื่อนไขของเวลา ภูมิอากาศ ฤดูกาล และสภาพแวดล้อมที่แตกต่างกันได้อีกด้วย โดยข้อดีของความหลากหลายเชิงเวลาคือเพิ่มปริมาณของข้อมูลที่ได้รับและสามารถใช้วิเคราะห์ ติดตาม และเฝ้าระวังการเปลี่ยนแปลงเชิงพื้นที่ได้ เช่น สังเกตการเจริญเติบโตของพืชพรรณการเกษตร หรือติดตามพื้นที่ก่อน ระหว่างและหลังการเกิดภัยธรรมชาติได้ ดาวเทียมแต่ละดวงจะมีคาบการบันทึกซ้ำที่แตกต่างกัน เช่น ดาวเทียม Landsat จะบันทึกซ้ำพื้นที่เดิมทุก 16 วัน ดาวเทียม SPOT จะบันทึกซ้ำพื้นที่เดิมทุก 26 วัน ส่วนตัวบันทึก MODIS Terra/Aqua สามารถให้ข้อมูลพื้นที่เดิมได้ถึงวันละ 4 ครั้ง เป็นต้น ความหลากหลายนี้สามารถนำมาใช้เป็นข้อมูลในการวิเคราะห์ร่วมกันได้ เช่น ใช้ภาพต่างช่วงเวลาทั้งจากตัวบันทึกเดียวกันหรือต่างกันวิเคราะห์การเปลี่ยนแปลง เป็นต้น
  3. ความหลากหลายของโพลาไรซ์ (multi-polarization) เป็นความแตกต่างของการวางตัวของระนาบสนามแม่เหล็กไฟฟ้าของคลื่น EM ในการบันทึกช่วงคลื่นไมโครเวฟ การบันทึกในช่วงค่าโพลาไรซ์ที่แตกต่างกันทั้ง VV, HH, VH, HV จะทำให้ได้ข้อมูลที่แตกต่างกันทั้งลักษณะและระดับความลึกข้อมูล
  4. ความหลากหลายของตัวบันทึก (multi-sensor image analysis) เป็นความหลากหลายข้อมูลภาพจากตัวบันทึกและดาวเทียมสำรวจที่เพิ่มมากขึ้น ตัวบันทึกของดาวเทียมแต่ละดวงมีลักษณะเฉพาะกันไป ทั้งคุณสมบัติพิเศษ การให้รายละเอียดเชิงพื้นที่ จำนวนแบนด์ ช่วงคลื่นการตรวจวัด คาบการบันทึกซ้ำ ฯลฯ รวมทั้งประโยชน์ ข้อดีและข้อจำกัดที่สามารถทำให้บันทึกและสำรวจข้อมูลได้แตกต่างกันในแต่สถานการณ์และจุดประสงค์การใช้งาน การรวมข้อมูลต่างตัวบันทึกจะทำให้ได้ข้อมูลที่หลากหลายและเป็นประโยชน์มากกว่าการใช้ข้อมูลจากตัวบันทึกเดียวและบางครั้งยังเป็นการช่วยยืนยันความถูกต้องของข้อมูลที่ได้อีกด้วย
  5. ความหลากหลายเชิงมาตราส่วน (multi-scale) เป็นความหลากหลายของมาตราส่วนและความละเอียดของข้อมูลการสำรวจจากระยะไกล ในการนำข้อมูลที่มีความแตกต่างนี้มาใช้ร่วมกันนั้นต้องมีการปรับพิกัดภาพให้ตรงกัน
  6. ความหลากหลายของข้อมูลเชิงพื้นที่อื่น (Multi of the other sources of spatial data) คือความหลากหลายของข้อมูลที่สามารถนำมาใช้ร่วมกันของข้อมูลจากการสำรวจระยะไกล เช่น ข้อมูลสิ่งปกคลุมดิน ข้อมูลระดับความสูง ข้อมูลลักษณะพื้นที่ ข้อมูลอุณหภูมิ ฯลฯ ข้อมูลดังกล่าวสามารถนำมาใช้ศึกษาร่วมกันได้ โดยการบูรณาการข้อมูลดังกล่าวข้อมูลต้องอยู่ในรูปดิจิตอล เช่น ในรูปแบบของชั้นข้อมูลระบบสารสนเทศภูมิศาสตร์
 
หลักการสำคัญอีกประการคือการหลอมรวมข้อมูลนั้น ข้อมูลที่ใช้ต้องมีลักษณะที่เข้ากันได้และพิกัดต้องตรงกัน ซึ่งต้องมีการปรับแก้เชิงเรขาคณิตและเชิงรังสีก่อน การทำ Registration ของข้อมูลต่างตัวบันทึกนั้น ประกอบด้วย 4 ขั้นตอนหลัก คือ การสกัดรูปลักษณ์ (Feature extraction) การจับคู่รูปลักษณ์ (Feature matching) การเลือกฟังก์ชั่นหรือพารามิเตอร์ในการแปลงข้อมูล (Transformation selection) และการทำ Image resampling (Image resampling)
 
โดยการหลอมรวมข้อมูลเพื่อการจำแนกข้อมูลภาพนั้น สามารถแบ่งออกได้เป็น 4 ระดับ คือ signal, pixel level, feature level และ decision level โดยในระดับ signal นั้นเป็นระดับเบื้องต้นในการนำสัญญาณจากแต่ละตัวบันทึกมารวมกันเพื่อสร้างสัญญาณใหม่ที่ดีกว่า ซึ่งหากข้อมูลที่ได้ไม่เพียงพอต่อการวิเคราะห์ต้องจำเป็นใช้เทคนิคการหลอมรวมในระดับที่สูงขึ้น ส่วนในระดับ pixel เป็นการหลอมรวมข้อมูลต่างภาพ pixel โดยใช้หลักการ pixel-by-pixel ก่อนการจำแนก ซึ่งจะแตกต่างจากระดับ feature ที่ต้องมีการสกัดรูปลักษณ์ก่อนแล้วค่อยนำข้อมูลดังกล่าวมาจำแนก การหลอมรวมข้อมูลระดับสูงสุดจะเป็นระดับ decision ซึ่งต้องมีการสกัดรูปลักษณ์ สร้าง module การจำแนกก่อน แล้วนำผลลัพธ์มารวมกัน แล้วจึงจำแนก