แสดงบทความที่มีป้ายกำกับ data Integration แสดงบทความทั้งหมด
แสดงบทความที่มีป้ายกำกับ data Integration แสดงบทความทั้งหมด

16/01/2560

Pentaho Data Integration (Excel to Mysql DB) [Transformation]



บทความนี้เป็นการนำข้อมูลที่อยู่ในไฟล์เอกสาร Excel ไปเข้าสู้ฐานข้อมูล MySql ซึ่งจะใช้โปรแกรม Xampp ในการจำลองฐานข้อมูลบน Localhost

Process ที่ใช้ใน Pentaho Data Integration (PDI)
  1. Microsoft Excel Input ใช้ในการนำเข้าข้อมูลเพื่อนำข้อมูลไป Transform เข้าสู่ MySQL
  2. Insert / Update หรือ Table Output ซึ่งบทความนี้จะใช้ Insert / Update เนื่องจาก Table Output จะเป็นการ Run เพียงรอบเดียวถ้ามีการ Run อีกรอบจะทำให้ข้อมูลมีการซ้ำหรือข้อมูลไม่เข้าสู่ฐานข้อมูลเนื่องจากเกิดการซ้ำของ Primary Key แต่การใช้ Inert / Update นั้นจะตรวจสอบว่าในฐานข้อมูลมี Primary Key ตัวนี้แล้วหรือไม่ ถ้ามีแล้วจะทำการ Update ข้อมูลที่เปลี่ยนแปลงใน Row เดิม แต่ถ้ายังไม่เคยมีข้อมูลนี้เลยจะถูก Insert เข้าไปเป็น Row ใหม่ในฐานข้อมูล

13/01/2560

การใช้งาน Pentaho Data Integration (Transformations)

นี้เป็นครั้งแรกที่ผมจะเริ่มใช้โปรแกรม Pentaho ซึ่งจะเน้นไปในเรื่องของการ Transformations ข้อมูล หรือคือการรวบรวมข้อมูลหลายๆที่มาคัดกรองข้อมูล หรือนำข้อมูลที่ได้มาตรวจสอบ

เรามาเริ่มการใช้งานเบื้องต้นกันเลยดีกว่า

ขั้นตอนแรกมาเริ่มสร้าง Project ให้ไปที่ Tools Bar ด้านบนไปที่ File -> New -> Transformation หรือกด Ctrl+N จะเป็นการเริ่ม Project ใหม่ ซึ่งค่าเร่มต้นชื่อ Project จะเป็น "Transformation 1"

ขั้นตอนการติดตั้ง Pentaho - Data Integration (Kettle)



Data Integration หรือ Kettle เป็นเครื่องมือที่ช่วยในการรวบรวมข้อมูลต่างๆ ก่อนการทำรายงาน(Report), วิเคราะห์ข้อมูล (Data Analysis)

วิธีการติดตั้งและเข้าใช้งาน

ขั้นตอนแรกให้ผู้ใช้เข้าไป Download โปรแกรม Data Integration - Kettle (Link)