บอทใหม่ ChatGPT ออกแล้ว สัญญาว่าจะหลอนน้อยลง

บอทใหม่ ChatGPT ออกแล้ว สัญญาว่าจะหลอนน้อยลง

OpenAI นำเสนอ GPT-4 ซึ่งเป็นวิวัฒนาการถัดไปของ Chatbot ที่ทุกคนชื่นชอบ นั่นคือ ChatGPT นอกเหนือจากโมเดลภาษาขั้นสูงที่ “แสดงประสิทธิภาพระดับมนุษย์ในการทดสอบทางวิชาชีพและวิชาการต่างๆ” เวอร์ชันใหม่ยังยอมรับอินพุตรูปภาพ และสัญญาว่าพฤติกรรมการปฏิเสธที่เข้มงวดยิ่งขึ้นจะหยุดไม่ให้ทำตามคำขอที่ไม่เหมาะสมของคุณรายงานทางเทคนิค GPT-4ที่มาพร้อมกัน(เปิดในแท็บใหม่)อย่างไรก็ตาม (PDF) เตือนว่าโมเดลใหม่ยังคงมีความสามารถที่ค่อนข้างสูงสำหรับสิ่งที่นักวิจัยเรียกว่า “ภาพหลอน” ซึ่งฟังดูปลอดภัยโดยสิ้นเชิง

สิ่งที่นักวิจัยหมายถึงเมื่อกล่าวถึงอาการประสาทหลอนก็คือ

 ChatGPT รุ่นใหม่ ซึ่งเหมือนกับรุ่นก่อนหน้า มีแนวโน้มที่จะ “สร้างเนื้อหาที่ไร้สาระหรือไม่เป็นความจริงเกี่ยวกับแหล่งข้อมูลบางแหล่ง” ลิงค์ผู้สนับสนุนแอพเดสก์ท็อปนี้ช่วยให้คุณเขียนได้อย่างมีประสิทธิภาพมากขึ้นไวยากรณ์แม้ว่านักวิจัยจะระบุชัดเจนว่า “GPT-4 ได้รับการฝึกอบรมเพื่อลดแนวโน้มของโมเดลที่จะประสาทหลอนโดยใช้ประโยชน์จากข้อมูลจากโมเดลก่อนหน้า เช่น ChatGPT” พวกเขาไม่เพียงแค่ฝึกฝนมันด้วยการคลำเองเท่านั้น แต่พวกเขายังฝึกฝนมันผ่านการประเมินโดยมนุษย์ อีกด้วย(เปิดในแท็บใหม่). 

“เรารวบรวมข้อมูลในโลกแห่งความเป็นจริงซึ่งถูกระบุว่าไม่เป็นข้อเท็จจริง ตรวจสอบและสร้างชุด ‘ข้อเท็จจริง’ สำหรับข้อมูลนั้นหากสามารถทำได้ เราใช้ข้อมูลนี้เพื่อประเมินการสร้างแบบจำลองที่เกี่ยวข้องกับ ‘ข้อเท็จจริง’ กำหนดและอำนวยความสะดวกในการประเมินของมนุษย์ “

กระบวนการนี้ดูเหมือนจะช่วยได้อย่างมากเมื่อพูดถึงหัวข้อปิด แม้ว่าแชทบอทจะยังมีปัญหาเมื่อพูดถึงจังหวะที่กว้างขึ้น ตามที่ระบุในกระดาษ GPT-4 ดีกว่า GPT-3.5 ถึง 29% เมื่อพูดถึงการแชท ‘โดเมนปิด’ แต่ดีกว่าเพียง 19% ในการหลีกเลี่ยงอาการประสาทหลอน ‘โดเมนเปิด’ 

ไอทีเน็กซ์(เปิดในแท็บใหม่)อธิบายความแตกต่างระหว่าง

โดเมนเปิดและโดเมนปิดว่า “ระบบ QA แบบโดเมนปิดคือระบบ QA ประเภทหนึ่งที่ให้คำตอบตามชุดข้อมูลที่จำกัดภายในโดเมนหรือฐานความรู้เฉพาะ” ระบบ QA แบบโดเมนเปิดแทน “ให้คำตอบตามข้อมูลที่มีอยู่มากมายบนอินเทอร์เน็ต และเหมาะที่สุดสำหรับความต้องการข้อมูลที่เฉพาะเจาะจงและจำกัด”

ใช่แล้ว เรายังมีแนวโน้มว่า Chat GPT-4 จะโกหกเราโดยตรงเกี่ยวกับเรื่องต่างๆ

แน่นอนว่าผู้ใช้จะไม่พอใจที่แชทบอทให้ข้อมูลเท็จแก่พวกเขา แม้ว่านี่จะไม่ใช่ปัญหาใหญ่ที่สุดก็ตาม หนึ่งในประเด็นหลักคือ แนวโน้มที่จะทำให้เกิดภาพหลอน “อาจเป็นอันตรายอย่างยิ่งเมื่อแบบจำลองมีความน่าเชื่อและน่าเชื่อมากขึ้น ซึ่งทำให้ผู้ใช้เชื่อมั่นมากเกินไป” รายงานระบุ

ภาพหลอนอาจกลายเป็นอันตรายมากขึ้นเมื่อแบบจำลองกลายเป็นความจริงมากขึ้น เนื่องจากผู้ใช้สร้างความไว้วางใจในแบบจำลองเมื่อให้ข้อมูลที่เป็นความจริงในพื้นที่ที่พวกเขาคุ้นเคย” เป็นเรื่องปกติที่เราจะเชื่อถือแหล่งข้อมูลหากข้อมูลนั้นแม่นยำมาก่อน แต่นาฬิกาเสียก็ถูกต้องสองครั้งต่อวันอย่างที่พวกเขาพูด

CPU ที่ดีที่สุดสำหรับการเล่นเกม(เปิดในแท็บใหม่): สุดยอดชิปจาก Intel และ AMD

Best gaming motherboard(เปิดในแท็บใหม่): บอร์ดที่เหมาะสม

การ์ดกราฟิกที่ดีที่สุด(เปิดในแท็บใหม่): ตัวดันพิกเซลที่สมบูรณ์แบบของคุณกำลังรอ

Best SSD สำหรับการเล่นเกม อยู่(เปิดในแท็บใหม่): เข้าเกมก่อนคนอื่น

การพึ่งพามากเกินไปกลายเป็นปัญหาโดยเฉพาะอย่างยิ่งเมื่อแชทบอทถูกรวมเข้ากับระบบอัตโนมัติที่ช่วยให้เราตัดสินใจภายในสังคม ซึ่งอาจทำให้เกิดวงจรป้อนกลับที่สามารถนำไปสู่ ​​”การลดคุณภาพของข้อมูลโดยรวม”

“สิ่งสำคัญคือต้องตระหนักว่าแบบจำลองนั้นไม่ได้แม่นยำเสมอไปในการยอมรับข้อจำกัดของมัน ซึ่งเห็นได้จากแนวโน้มที่จะทำให้เกิดภาพหลอน”

นอกเหนือจากปัญหาแล้ว ผู้พัฒนาดูเหมือนจะค่อนข้างมองโลกในแง่ดีเกี่ยวกับโมเดลใหม่ อย่างน้อยก็ตามภาพรวมของ GPT-4(เปิดในแท็บใหม่)บนเว็บไซต์ OpenAI

“เราพบและแก้ไขจุดบกพร่องบางอย่างและปรับปรุงพื้นฐานทางทฤษฎีของเรา ผลก็คือ การฝึก GPT-4 ของเรา (อย่างน้อยก็สำหรับเรา!) เสถียรอย่างไม่เคยมีมาก่อน”

เราจะเห็นสิ่งนั้นเมื่อมันเริ่มขึ้นพร้อมกับการจุดไฟอีกครั้งแม้ว่าจะเกิดการล่มสลาย(เปิดในแท็บใหม่)เราได้ยินมาว่าส่วนใหญ่มาจากการรวม ChatGPT ของ Bing

Credot : ยูฟ่าสล็อต