คลังเก็บป้ายกำกับ: ภาษาของ Google AI

ถ้าฟังดูถูกต้องก็ต้องเป็นมนุษย์ ภาษาของ Google AI ทำให้เราเป็นผู้ฟังที่ตื้น

เครื่องความรู้สึกจะสำรวจความแตกต่างระหว่างภาษาที่คล่องแคล่วและความคิดที่คล่องแคล่ว—และผลที่ตามมาของการทำให้ทั้งสองสับสน

เมื่อคุณอ่านประโยคแบบนี้ ประสบการณ์ในอดีตของคุณจะบอกคุณว่าประโยคนั้นเขียนขึ้นจากการคิด ความรู้สึกของมนุษย์ และในกรณีนี้ มีมนุษย์คนหนึ่งพิมพ์คำเหล่านี้: [สวัสดี!] แต่ทุกวันนี้ ประโยคบางประโยคที่ดูเหมือนมนุษย์อย่างน่าทึ่ง แท้จริงแล้วสร้างโดยระบบปัญญาประดิษฐ์ที่ได้รับการฝึกฝนเกี่ยวกับข้อความของมนุษย์จำนวนมหาศาล

ภาษาของ Google AI ผู้คนคุ้นเคยกับการคิดว่าภาษาที่คล่องแคล่วนั้นมาจากการคิด รู้สึกว่าเป็นมนุษย์ซึ่งหลักฐานที่ตรงกันข้ามอาจเป็นเรื่องยากที่จะปิดบังความคิดของคุณ ผู้คนมีแนวโน้มที่จะสำรวจดินแดนที่ไม่คุ้นเคยนี้อย่างไร เนื่องจากมีแนวโน้มอย่างต่อเนื่องที่จะเชื่อมโยงการแสดงออกอย่างคล่องแคล่วกับความคิดที่คล่องแคล่ว จึงเป็นเรื่องธรรมดา แต่อาจทำให้เข้าใจผิด ที่จะคิดว่าหากแบบจำลอง AI สามารถแสดงออกได้อย่างคล่องแคล่ว นั่นหมายความว่ามันคิดและรู้สึกเหมือนมนุษย์ทำ

ดังนั้นจึงอาจไม่น่าแปลกใจที่อดีตวิศวกรของ Google เพิ่งอ้างว่าระบบ AI ของ LaMDA ของ Google มีความรู้สึกในตัวเองเพราะสามารถสร้างข้อความเกี่ยวกับความรู้สึกโดยเจตนาได้อย่างคล่องแคล่ว เหตุการณ์นี้และการรายงานข่าวของสื่อที่ตามมาทำให้เกิดบทความและโพสต์ที่น่าสงสัยเกี่ยวกับคำกล่าวอ้างที่ว่าแบบจำลองทางคอมพิวเตอร์ของภาษามนุษย์มีความละเอียดอ่อน ซึ่งหมายความว่าสามารถคิด รู้สึก และประสบได้

คำถามที่ว่าโมเดล AI มีความละเอียดอ่อนหมายความว่าอย่างไร (ดูตัวอย่างจากความเห็นของเพื่อนร่วมงาน) และเป้าหมายของเราที่นี่ไม่ใช่เพื่อแก้ปัญหา แต่ในฐานะนักวิจัยด้านภาษา เราสามารถใช้งานของเราในด้านวิทยาศาสตร์ความรู้ความเข้าใจและภาษาศาสตร์เพื่ออธิบายว่าทำไมมนุษย์จึงตกหลุมพรางของความคิดที่ว่าสิ่งที่สามารถใช้ภาษาได้อย่างคล่องแคล่วนั้นง่ายเกินไป

คือความรู้สึก มีสติสัมปชัญญะ หรือฉลาด การใช้ AI เพื่อสร้างภาษาที่เหมือนมนุษย์ ข้อความที่สร้างโดยโมเดลอย่าง LaMDA ของ Google นั้นแยกแยะได้ยากจากข้อความที่มนุษย์เขียนขึ้น ความสำเร็จที่น่าประทับใจนี้เป็นผลมาจากโครงการที่ยาวนานหลายทศวรรษในการสร้างแบบจำลองที่สร้างภาษาตามหลักไวยากรณ์และมีความหมาย

เวอร์ชันแรกๆ ย้อนหลังไปถึงอย่างน้อยในทศวรรษ 1950 หรือที่รู้จักในชื่อโมเดล n-gram เพียงแค่นับการเกิดขึ้นของวลีเฉพาะและใช้เพื่อคาดเดาว่าคำใดมีแนวโน้มที่จะเกิดขึ้นในบริบทเฉพาะ ตัวอย่างเช่น ง่ายที่จะรู้ว่า “เนยถั่วและเยลลี่” เป็นวลีที่มีแนวโน้มมากกว่า “เนยถั่วและสับปะรด” หากคุณมีข้อความภาษาอังกฤษเพียงพอ คุณจะเห็นวลี “เนยถั่วและเยลลี่” ซ้ำแล้วซ้ำเล่า แต่อาจไม่เคยเห็นวลี “เนยถั่วกับสับปะรด”

โมเดลปัจจุบัน ชุดข้อมูล และกฎเกณฑ์ที่ใกล้เคียงกับภาษามนุษย์ แตกต่างจากความพยายามครั้งแรกเหล่านี้ในวิธีที่สำคัญหลายประการ ประการแรกพวกเขาได้รับการฝึกอบรมเกี่ยวกับอินเทอร์เน็ตทั้งหมด ประการที่สอง พวกเขาสามารถเรียนรู้ความสัมพันธ์ระหว่างคำที่อยู่ห่างไกลกัน ไม่ใช่แค่คำที่อยู่ใกล้เคียง ประการที่สาม ลูกบิดเหล่านี้ปรับแต่งโดย “ปุ่ม” ภายในจำนวนมาก ซึ่งยากสำหรับแม้แต่วิศวกรที่ออกแบบให้เข้าใจว่าทำไมพวกเขาถึงสร้างลำดับของคำหนึ่งแทนที่จะเป็นอีกคำหนึ่งอย่างไรก็ตาม งานของนางแบบยังคงเหมือนเดิมในทศวรรษ 1950: พิจารณาว่าคำใดน่าจะมาในลำดับต่อไป วันนี้พวกเขาเก่งมากในงานนี้จนเกือบทุกประโยคที่สร้างดูเหมือนลื่นไหลและถูกต้องตามหลักไวยากรณ์

 

สนับสนุนโดย.  หน้ากากแอร์