การ ทำ Machine Learning

Thursday, 12-May-22 19:22:46 UTC

English
Model

การสร้าง Machine Learning Model ด้วย AutoML เป็นบริการใน GCP (Google Cloud Platform) ที่ช่วยให้เราสามารถสร้างโมเดล machine learning ขึ้นมาใช้งานกับข้อมูลเฉพาะทางได้ โดยไม่จำเป็นต้องใช้ทักษะขั้นสูงของ data science ปัจจุบัน AutoML มีรูปแบบให้บริการอยู่ 3 ตัว และยังอยู่ในสถานะ beta คือ AutoML Vision AutoML Natural Language AutoML Translation วันนี้เราจะมาลองสร้างโมเดลส้มตำด้วย AutoML Vision กันครับ AutoML Vision VS Vision API ทำไมเราถึงต้องใช้ machine learning ในการอ่านไฟล์รูปภาพ?

English

Deploy model หรือ การสร้างโมเดลเพื่อใช้งานจริง เมื่อเราทดสอบโมเดล ML จนพอใจแล้ว ขั้นตอนสุดท้ายก็คือ การนำโมเดลนั้น มาสร้าง "ระบบ" เพื่อให้เหมาะสมกับการใช้งานจริง ในขั้นตอนนี้ก็อาจจะมีการออกแบบเพิ่มในส่วนของการใช้งาน เช่น Application นี้จะมีหน้าตามเป็นแบบไหน สีอะไร? การอ่านสีหน้าจะอ่านจากรูปโดยการอัพโหลด หรือ การ selfie?

ทำไมพวกเราต้องสนใจเกี่ยวกับ Machine Learning?

หาสินค้าที่สมาชิกเข้าชมบ่อยที่สุดหรือสินค้าที่เคยซื้อ ในช่วง 1-2 สัปดาห์ที่ผ่าน 2. นำข้อมูลสินค้าจากข้อ 1 ไปค้นหาสมาชิกคนอื่น ที่เคยเข้าดูสินค้าหรือเคยซื้อ เหมือนกับสมาชิกในข้อ 1 จำนวน 10 คน มีเพศเดียวกัน อายุเฉลี่ยห่างกันไม่เกิน 5 ปี ตัวอย่างเช่น สมาชิกคนที่ 1 อายุ 25 สมาชิกที่อยู่ในเกณฑ์ต้องมีอายุ 20 – 30 ปี และเป็นเพศเดียวกัน 3. นำสมาชิกทั้ง 10 คนจากข้อ 2 ไปค้นหาว่า สินค้าอื่น ๆ ที่สมาชิกทั้ง 10 คนเคยเข้าชมหรือเคยซื้อ 10 อันดับแรกคือสินค้าอะไรบ้าง 4. จากข้อ 3 เราจะได้สินค้าทั้งหมดคือ 10×10 = 100 ชิ้น นำสินค้าทั้ง 100 มาคิดคะแนนลำดับ สินค้าชิ้นไหนซ้ำกันมากที่สุด หรือมีการเข้าชมมากที่สุด ให้มีคะแนนแนะนำสูงที่สุด เมื่อประมวลผลแล้วอาจจะมีสินค้าแนะนำ และมีแนวโน้มที่สมาชิกในข้อ 1 จะซื้อเหลืออยู่ไม่ถึง 100 ชิ้น 5.

เพื่อเตรียม Dataset ให้พร้อมสำหรับการทำ Data Analytics หรือ เป็น Input ของ Machine Learning Algorithm เพื่อเพิ่มประสิทธิภาพให้ Machine Learning Model ในบทความนี้ผู้อ่านจะได้ฝึกปฏิบัติการทำ Feature Engineering กับข้อมูล Wine Magazine Dataset โดยใช้เทคนิคต่างๆ 7 เทคนิค ได้แก่ Imputation Handling Outliers Drop Outlier with Standard Deviation Drop with Percentiles Binning Log Transform One-hot Encoding และทำการ dowload data ที่เราจะใช้งาน ต่อมาอ่านไฟล์ที่เราโหลดมาเก็บไว้ในตัวแปล แสดงข้อมูล Dataset ผลการแสดงข้อมูลด้านบนทำให้เราพบว่าข้อมูลทั้งหมดมีmissing values อยู่8. 1% และcolum Age มี missing values อยู่ที่ 19.

Model

อธิบาย K-Fold Cross Validation พร้อมโค้ดตัวอย่างใน R เทคนิคที่เรียกว่าเป็น Golden Standard สำหรับการสร้างและทดสอบ Machine Learning Model คือ "K-Fold Cross Validation" หรือเรียกสั้นๆว่า k-fold cv เป็นหนึ่งในเทคนิคการทำ Resampling ไอเดียของ k-fold cv คือการแบ่งข้อมูลเป็น k ส่วนเท่าๆกันเพื่อสร้างและทดสอบโมเดล (train + validate) คำนวณค่าเฉลี่ย accuracy หรือ error (i. e. model performance) ก่อนที่จะนำโมเดลไปใช้ทำนายข้อมูล test set รูปด้านล่างแสดงการแบ่งข้อมูลเป็น 5 folds เท่าๆกัน โดยการแบ่งข้อมูลต้องเป็นไปอย่าง random ทำไมต้อง random? เพราะ randomness จะช่วยให้ข้อมูลในแต่ละ fold มีการกระจายตัวใกล้เคียงกัน ช่วยลด bias เวลาที่เราสร้างและทดสอบโมเดล จำนวน k ที่นิยมใช้กันในทางปฏิบัติมีสองค่าคือ k=5… Read More ไกลแค่ไหนคือใกล้กับการวัดระยะแบบ Euclidean Distance บทความนี้มาเรียนวิธีการคำนวนระยะทาง i. distance ง่ายๆระหว่างสอง data points โดยตัวที่เราจะสอนวันนี้ชื่อว่า Euclidean distance สูตรการวัดระยะยอดนิยมในงาน data science – Enough talk! Let's do it. Euclidean Distance สมมติเรามี data points 2 จุด (20, 75) และ (30, 50) จงหาระยะห่างของสองจุดนี้ ถ้ายังจำได้สมัยประถม (แอดค่อนข้างมั่นใจว่าเรียนกันตั้งแต่ ป.

Machine Learning ในปัจจุบันถูกใช้อย่างไรบ้าง?

การ ทำ machine learning pdf
การ ทำ machine learning center
การ ทำ machine learning 2

solvingscarcity.org

การ ทำ Machine Learning

English

Model