วันเสาร์ที่ 2 พฤศจิกายน พ.ศ. 2562

Introduction Big Data ใน 3 นาที

Intro Big Data ใน 3 นาที

-----------------------------------------------------------------------------
Big Data = การจัดการ  "ข้อมูล" ในแบบใหม่ เพื่อให้เกิดประโยชน์

"ข้อมูล"  ที่มีลักษณะนี้
  • (ข้อมูล) มี "ขนาด" ใหญ่มาก
  • (ข้อมูล) มาจาก "หลากหลายชนิด" (ตาราง,รูป,vdo,...)
  • (ข้อมูล) เปลี่ยนแปลง "เร็ว" (ในช่วงเวลาสั้นๆ เกิด data ปริมาณมาก)
  • (ข้อมูล) มีความ ไม่น่าเชื่อถือ แทรกอยู่ 
    (เช่น มีการจ้างโหวต  ทำให้ คะแนนโหวต ไม่สะท้อน) 
       ตย. IBM เคยจัดลักษณะไว้ 4V 
-----------------------------------------------------------------------------
สิ่งต่อไปนี้ ไม่ใช่ (การจัดการ) Big Data เพราะ ลักษณะ "ไม่ครบ"
       (มองเป็น จัดการ Data ทั่วไป)
  • มีข้อมูล 10 ปี - อยู่ใน DB2, MS SQL Server, MySQL, ...
  • มีข้อมูล 2 เทราไบต์ - เก็บ VDO ,รูปภาพ
-----------------------------------------------------------------------------
ย้ำ - เพื่อให้เกิดประโยชน์ -ไม่ใช่ สนใจ "แค่มี" เท่านั้น 

ตย. การใช้งาน
  • "ใช้ข้อมูล  การขายในระบบ (MySQL) ร่วมกับ คำติ/ชม ใน WebBoard,Facebook, Pantip, Instragram"
  • เพิ่ม รูปแบบผลลัพธ์ -> ได้แนวทางใหม่
    นำคำชม/วิจารณ์ ใน Blog มาปรับ แผนการตลาด
  • นมำมาสร้าง   AI ด้าน ...
-----------------------------------------------------------------------------
มาลงลึก ทางเทคนิคกัน 

-Disk  เพิ่ม ขนาดได้ ,ทำงานได้เร็ว ,ราคาเหมาะสม
-software จัดการ Data
  • Structure Data  กลุ่ม RDBMS
    เช่น DB2, MS SQL Server, mySQL, ... เป็นต้น
    + วิธีจัดเก็บ Index เพื่อความเร็ว - Data warehouse, BI (Business Intelligence)
  • Un-Structure Data  กลุ่ม XML ,JSON (Web Board ต่างๆ, Image, VDO)
    เช่น Mongo, neo4gen, ...  เป็นต้น
    + วิธีจัดเก็บ Index เพื่อความเร็ว - Hadoop

-Server, OS  (มักมอง พร้อมกับ ด้านบน และ ทีมงาน)
  เช่น MS SQL Server ใช้ดีกว่า Windows, MySQL ใช้กับ Unique ได้  เป็นต้น

>> ภาพรวม  สิ่งที่ต้องทำ 
  • เครื่องมือ,อุปกรณ์
    • ใช้ Cloud  (รวมหลายเรื่อง)
  • วิธีการ
    • ใช้อุปกรณื IoT เพิ่ม  สร้าง Data อย่างละเอียด ปริมาณมาก 
  • คน
    • ผู้นำ ที่เห็นภาพรวม
    • พัฒนา ทีม วิเคราะห์ข้อมูล "จากรูปแบบใหม่" 
    • พัฒนา ทีม IT (Data Science + Data Engineer)


-----------------------------------------------------------------------------

นอกเรื่อง

(ส่วนตัว) เชื่อว่า  ปัญหา ใหญ่  ไม่ใช่ งบฯ
แต่เป็นที่ "คน" ไม่พร้อม  และ  วิธีการ "ไม่เหมาะ"
  • ไม่รู้  เลย (ไม่อยากรู้ , ไม่อยากเสียเวลา)
  • เคยได้ยิน แต่ ไม่สนใจ (ไม่ใช่ หน้าที่ , ถูกสั่งว่า ห้าม ทำ)
  • อยากเรียนรู้ แต่ มันยาก (เริ่มไม่ถูก  เนื้อหา "มาก" และ "เปลี่ยนเร็ว")
    ไม่รู้  วิธีเรียนรู้  ที่เหมาะ กับยุคนี้
คนรุ่น เก่า  :  เรียน s/w ที่มาตรฐาน (ไม่เปลี่ยนมา 5 ปีแล้ว) - ราคาแพง
คนรุ่น ใหม่ :  เรียน s/w ที่เพิ่งเปิดใช้ แล้ว ดัง + ฟรี - ทยอยสะสม ศัพท์ใหม่ๆ

คนรุ่น เก่า :  ต้องมี "คนสอน" (course อบรม ระดับ-1,2,3)
                    เรียนแล้วทำตามได้ แน่นอน - ต้อง "รอ" ให้เปิดสอน , "รอ" เรียนครบ(น่าจะเก่ง)
คนรุ่น ใหม่ :  ดู YouTube, อ่านจาก บทความ เอง
                     ทำตามอาจจะไม่สำเร็จ - เรียนที่ไหนก็ได้ "ทันที"


คน(ไทย) ส่วนใหญ่ ยังไม่คุ้นกับ  การเรียนรู้ด้วยตนเอง + การทำงานเป็น "ทีม"
     คนรุ่นเก่า มีส่วนใหญ่ สร้าง/ส่งเสริม   วัฒนธรรมนี้ไว้  โดยไม่รู้ตัว

ถ้าเข้าใจ  และ  ผสมผสานได้ จะได้ผลลัพธ์ ที่ดีครับ
เตรียมตั้งแต่  เด็ก, พนักงานใหม่, จัด คนรุ่นเก่า (มาสนับสนุน ,ไม่ให้ ขัดขวาง)