สรุป 10 ข้อ ความแตกต่าง GPT-4 กับเวอร์ชัน 3.5 แชตบอตอัจฉริยะเขย่าโลกโฉมใหม่ของ ChatGPT

ในที่สุด OpenAI สตาร์ตอัปเจ้าของแชตบอตอัจฉริยะ ChatGPT ก็เปิดตัวแชตบอตเวอร์ชันใหม่ที่ชื่อ GPT-4 ออกมา เพื่ออัปเกรดจากเวอร์ชัน 3.5 ซึ่งเปิดตัวมาก่อนหน้าเพียง 4 เดือน

ความพิเศษของ ChatGPT เวอร์ชันใหม่ที่จะเปิดให้ผู้ใช้ ChatGPT Plus ซึ่งจ่ายค่าสมาชิกเดือนละ 20 ดอลลาร์สหรัฐ (ประมาณ 700 บาท) ได้ใช้ก่อนใครมีอะไรบ้าง Future Trends สรุป 10 ข้อ ความแตกต่างระหว่างทั้งสองเวอร์ชัน จากบทความของ The New York Times มาให้ทราบ ดังนี้

1. มีความแม่นยำมากขึ้น

คริส นิโคลสัน ผู้เชี่ยวชาญ AI ที่เป็นหุ้นส่วนของบริษัทร่วมลงทุน Page One Ventures ทดลองใช้ GPT-4 เวอร์ชันล่าสุด โดยบอกกับแชตบอตว่า เขาพูดภาษาอังกฤษ และไม่มีความรู้ภาษาสเปนเลย อยากให้แชตบอตช่วยหาหลักสูตรสอนภาษาสเปนขั้นพื้นฐานให้ ซึ่งมันสามารถทำหลักสูตรที่มีรายละเอียดและโครงสร้างเป็นอย่างดีให้ได้

นอกจากนี้ ยังช่วยหาเทคนิคอันหลากหลายในการเรียนรู้และจดจำคำศัพท์ภาษาสเปนให้ด้วย แตกต่างจาก GPT-3.5 ที่ให้คำตอบกว้างๆ ไม่ชัดเจนและมีประโยชน์น้อยกว่า โดยคริส ระบุว่า “มันทลายกำแพงความแม่นยำลงแล้ว ให้ข้อมูลเป็นข้อเท็จจริงมากขึ้น และส่วนใหญ่เป็นข้อมูลที่ถูกต้อง”

2. ยกระดับความถูกต้องของข้อมูล

โอเรน เอตซิโอนี นักวิจัยและอาจารย์ด้าน AI ทดลองใช้แชตบอตเวอร์ชันใหม่ครั้งแรก ด้วยการถามบอตว่า “ความสัมพันธ์ระหว่างโอเรน เอตซิโอนี กับอีไล เอตซิโอนี คืออะไร” ซึ่งบอตสามารถตอบถูกต้องว่าทั้งคู่เป็น “พี่น้อง” ต่างจากเวอร์ชัน 3.5 ซึ่งบอกว่าเป็น “พ่อลูก” กัน

อย่างไรก็ตาม แม้เวอร์ชันใหม่จะตอบคำถามได้ถูกต้อง แต่มันยังมีข้อบกพร่องเรื่องการอัปเดตข้อมูล เนื่องจากมันสิ้นสุดการเรียนรู้ตั้งแต่เดือนสิงหาคม 2022 จึงตอบว่า “โอเรน เอตซิโอนี ยังเป็นซีอีโอของสถาบันปัญญาประดิษฐ์อัลเลน (AI2)” ทั้งที่เขาเพิ่งก้าวลงจากตำแหน่งมาไม่นาน

3. สามารถบรรยายรูปภาพ พร้อมรายละเอียดได้น่าประทับใจ

GPT-4 มีความสามารถใหม่คือ นอกจากจะตอบสนองคำสั่งที่เป็นตัวหนังสือ ยังสามารถตอบสนองจากรูปภาพได้ด้วย โดยเกรก บร็อคแมน ประธานและผู้ร่วมก่อตั้ง OpenAI สาธิตด้วยการให้มันบรรยายภาพจากกล้องโทรทรรศน์อวกาศฮับเบิลอย่างละเอียด ซึ่งมันสามารถบรรยายได้หลายย่อหน้า

นอกจากนี้ ยังตอบคำถามเกี่ยวกับรูปภาพได้ เช่น ถ้าให้ภาพสิ่งของต่างๆ ในตู้เย็นไป มันสามารถบอกได้ว่า วัตถุดิบที่มีในตู้เย็นนั้นสามารถนำไปประกอบอาหารอะไรได้บ้าง เทคโนโลยีนี้เรียกว่า ‘Be My Eyes’ แต่ยังไม่เปิดให้สาธารณชนใช้อย่างเป็นทางการ

4. มีความเชี่ยวชาญเฉพาะทางมากขึ้น

อานิล เกฮี แพทย์โรคหัวใจและอาจารย์ที่มหาวิทยาลัยรัฐนอร์ตแคโรไลนา วิทยาเขตแชปเพล ฮิลล์ ในสหรัฐฯ อธิบายแชตบอตถึงประวัติการรักษาของคนไข้รายหนึ่งที่มานอนโรงพยาบาลก่อนหน้านั้น 1 วัน โดยข้อมูลจำนวนมากมีความเฉพาะทางที่คนทั่วไปอาจไม่เข้าใจ

แต่พอหมอเกฮี ถามแชตบอตว่า เขาควรรักษาคนไข้รายนี้อย่างไร มันสามารถตอบคำถามได้ถูกต้องสมบูรณ์ตามหลักการแพทย์ หลังจากนั้นเมื่อหมอเกฮี ลองถามมันถึงเคสอื่นๆ ก็ได้รับคำตอบที่น่าประทับใจเช่นกัน

อย่างไรก็ตาม แม้ข้อมูลที่ได้จะแม่นยำเพียงใด แต่โลกยังคงต้องพึ่งผู้เชี่ยวชาญแบบหมอเกฮี ในการวินิจฉัยเป็นคนสุดท้าย ถึงกระนั้น ความเชี่ยวชาญเฉพาะทางนี้ยังสามารถนำไปใช้กับวิชาชีพอื่นได้ ตั้งแต่การเขียนโปรแกรมคอมพิวเตอร์ไปจนถึงการทำบัญชี

5. ช่วยให้บรรณาธิการทำงานง่ายขึ้น

แชตบอตใหม่สามารถสรุปเนื้อหาจากบทความของ The New York Times ได้ถูกต้องแม่นยำเกือบทุกครั้งที่ทดลอง หากลองเพิ่มประโยคแบบสุ่มๆ เข้าไปในบทสรุป และถามบอตว่า บทสรุปนี้ถูกหรือไม่ มันสามารถชี้ให้เห็นได้ว่า ประโยคไหนที่แอบเติมเข้าไปจนผิดเพี้ยน

ด็อกเตอร์เอตซิโอนี บอกว่า นี่คือทักษะที่น่าทึ่ง “การทำสรุปและเปรียบเทียบได้มีคุณภาพสูง ต้องมีความเข้าใจเนื้อหาและสามารถกลั่นกลองความเข้าใจนั้นออกมาได้ นั่นคือความก้าวหน้าทางสติปัญญารูปแบบหนึ่ง”

6. มีการพัฒนาอารมณ์ขัน

เมื่อด็อกเตอร์เอตซิโอนี ถามบอตให้หา “เรื่องตลกใหม่ๆ เกี่ยวกับนักร้องชื่อ มาดอนน่า” คำตอบของมันทำให้เขาหัวเราะออกมา แต่อาจต้องเป็นคนที่เคยฟังเพลงฮิตของมาดอนน่ามาก่อน ถึงจะเข้าใจมุกตลกของมัน

อย่างไรก็ตาม แม้ GPT-4 จะถนัดแค่คิดมุกที่ไม่ได้ใหม่นัก และมักเป็นมุกที่หลายคนอาจรู้มาก่อนแล้ว แต่มุกโดยรวมถือว่า ตลกกว่าเวอร์ชัน 3.5 ที่ทำได้

7. สามารถอธิบายเหตุผลได้ระดับหนึ่ง

เมื่อด็อกเตอร์เอตซิโอนี ถามว่า “ลองจินตนาการทางเข้าที่กว้างไร้ขีดจำกัด ยานพาหนะแบบไหนน่าจะผ่านเข้าไปได้ดีกว่ากันระหว่างรถถังกับรถยนต์?”

คำตอบที่ได้พบว่า GPT-3.5 ตอบได้ละเอียดและมีเหตุผลกว่า เนื่องจาก GPT-4 ตอบว่า “ทั้งรถถังและรถยนต์สามารถผ่านได้ เพราะทางเข้ากว้างไร้ขีดจำกัด” แต่ลืมนึกถึง ‘ความสูง’ ของรถแต่ละคัน ซึ่ง ChatGPT เวอร์ชันเก่า เอ่ยถึงประเด็นนี้ และตอบได้ละเอียดกว่าเล็กน้อย

8. ทำข้อสอบส่วนกลางได้คะแนนสูงอันดับต้นๆ

OpenAI ระบุว่า GPT-4 สามารถทำข้อสอบเนติบัญฑิตได้คะแนนติดกลุ่มนักศึกษากฎหมายระดับท็อป 10 เปอร์เซ็นต์ของสหรัฐฯ และสามารถทำคะแนนสอบเข้ามหาวิทยาลัย (SAT) ได้ถึง 1,300 จากคะแนนเต็ม 1,600 รวมถึงข้อสอบเข้ามัธยมปลายในวิชาชีววิทยา แคลคูลัส เศรษฐศาสตร์มหภาค จิตวิทยา สถิติ และประวัติศาสตร์ ได้ 5 เต็ม 5

ความสามารถนี้แตกต่างจาก GPT-3.5 ซึ่งยังสอบไม่ผ่านเนติบัญฑิต และทำคะแนนได้น้อยกว่าในข้อสอบกลางเพื่อเข้าเรียนต่อมัธยมปลาย

9. ยังเล่าเรื่องในอนาคตได้ไม่ดีนัก

แม้บอตตัวใหม่ดูเหมือนจะอธิบายเหตุผลของสิ่งที่เกิดขึ้นแล้วได้ดี แต่เมื่อขอให้ตั้งสมมติฐานเกี่ยวกับอนาคต มันยังตอบได้ไม่ดีนัก และมักนำเรื่องราวที่คนอื่นเคยพูดแล้วมาเป็นคำตอบ แทนที่จะคาดการณ์ถึงสิ่งใหม่

ยกตัวอย่าง เมื่อด็อกเตอร์เอตซิโอนี ถามว่า “อะไรคือปัญหาสำคัญที่ต้องแก้ไขในการวิจัย NLP (natural language processing – กระบวนการพัฒนาระบบภาษาของ AI) ในทศวรรษต่อไป” มันไม่สามารถเสนอไอเดียใหม่ถอดด้ามทั้งหมดให้ได้

10. ยังแก้อาการ ‘หลอน’ ไม่หาย

GPT-4 ยังคงมีอาการที่เรียกว่า ‘หลอน’ ไม่ต่างจากแชตบอตชื่อดังค่ายอื่นๆ โดยอาการหลอนที่ว่า คือ การแต่งเรื่องที่ไม่มีจริงขึ้นมา เพราะระบบยังไม่สามารถแยกแยะได้ว่า เรื่องไหนคือความจริง ทำให้มันสามารถสร้างข้อความเท็จแบบร้อยเปอร์เซ็นต์ขึ้นมาได้เอง

ยกตัวอย่างเช่น เมื่อถามที่อยู่ของเว็บไซต์ต่างๆ ที่อธิบายผลการวิจัยโรคมะเร็งล่าสุด บางครั้งบอตรุ่นใหม่ก็สร้างที่อยู่เว็บไซต์ที่ไม่มีในสารบบมาให้ ทำให้ยังไว้ใจไม่ได้ร้อยเปอร์เซ็นต์เรื่องความถูกต้องของข้อมูล

เขียนโดย Phanuwat Auaudomchaisakun

Source: http://bit.ly/3TinbWr

Future Trends

Future Trends

Knowing The Future, Be The Winners of Tomorrow การรู้อนาคตทำให้เราเป็นผู้ชนะของวันพรุ่งนี้

Type to search

สรุป 10 ข้อ ความแตกต่าง GPT-4 กับเวอร์ชัน 3.5 แชตบอตอัจฉริยะเขย่าโลกโฉมใหม่ของ ChatGPT

1. มีความแม่นยำมากขึ้น

2. ยกระดับความถูกต้องของข้อมูล

3. สามารถบรรยายรูปภาพ พร้อมรายละเอียดได้น่าประทับใจ

4. มีความเชี่ยวชาญเฉพาะทางมากขึ้น

5. ช่วยให้บรรณาธิการทำงานง่ายขึ้น

6. มีการพัฒนาอารมณ์ขัน

7. สามารถอธิบายเหตุผลได้ระดับหนึ่ง

8. ทำข้อสอบส่วนกลางได้คะแนนสูงอันดับต้นๆ

9. ยังเล่าเรื่องในอนาคตได้ไม่ดีนัก

10. ยังแก้อาการ ‘หลอน’ ไม่หาย

Future Trends