Home
Tech & Innovation
AI
งานวิจัยชี้ ข้อความของ AI แยกกับข้อความของคนได้ง่ายเพราะดูเป็นมิตรเกินไป

งานวิจัยชี้ ข้อความของ AI แยกกับข้อความของคนได้ง่ายเพราะดูเป็นมิตรเกินไป

วัชรกุล พัฒนาประทีปAI4 months ago45 Views

THE SUMMARY:

ใครที่กำลังเห็นคอนเทนต์ โพสต์ หรือการตอบกลับข้อความที่ดูสุภาพมากเป็นพิเศษอาจจะต้องเอะใจสักหน่อยว่าข้อความเหล่านั้น อาจเป็นข้อความที่ถูกคิดขึ้นมาโดย AI เนื่องจาก AI ยังไม่สามารถเลียนแบบสไตล์การสื่อสารแบบมนุษย์ได้อย่างสมจริง

ทีมนักวิจัยจากมหาวิทยาลัยซูริค, มหาวิทยาลัยอัมสเตอร์ดัม, มหาวิทยาลัยดุ๊ก (Duke University) และมหาวิทยาลัยนิวยอร์ก ได้เผยแพร่ผลการศึกษาที่ชี้ให้เห็นว่า ภาษาของโมเดล AI ยังสามารถแยกจากลักษณะการสื่อสารของมนุษย์ได้อย่างชัดเจน โดยเฉพาะเรื่องโทนภาษาเชิงอารมณ์ที่เป็นมิตรเกินไป ซึ่งเป็นจุดสังเกตที่ชัดเจนและดูง่ายที่สุด งานวิจัยดังกล่าวได้ทดสอบโมเดล AI แบบเปิดทั้งหมด 9 โมเดล บนแพลตฟอร์ม Twitter/X, Bluesky และ Reddit พบว่า เครื่องมือจำแนกข้อความที่นักวิจัยพัฒนาขึ้นสามารถตรวจจับข้อความที่สร้างโดย AI ได้ด้วยความแม่นยำ 70–80% เลยทีเดียว

ทีมนักวิจัยได้พยายามปรับแต่งโมเดลใหม่หลายครั้ง ตั้งแต่ การเปลี่ยน prompt หรือคำสั่งไปจนถึงการเทรนเพิ่มเติม แต่พบว่าการบ่งบอกทางอารมณ์ของข้อความยังคงเป็นตัวชี้วัดได้ว่าข้อความใดคิดขึ้นโดย AI โดยการทดสอบโมเดลนั้นครอบคลุม LLM ทั้งหมด 9 รุ่น ได้แก่ Llama 3.1 8B, Llama 3.1 8B Instruct, Llama 3.1 70B, Mistral 7B v0.1, Mistral 7B Instruct v0.2, Qwen 2.5 7B Instruct, Gemma 3 4B Instruct, DeepSeek-R1-Distill-Llama-8B และ Apertus-8B-2509

ข้อความที่ AI สร้างขึ้นมักขาดอารมณ์ด้านลบแบบธรรมชาติและการแสดงความรู้สึกแบบทันทีทันใดที่มักพบในข้อความของมนุษย์ โดยคะแนนความท็อกซิกของ AI นั้นต่ำกว่าข้อความจริงของมนุษย์ในทุกแพลตฟอร์ม

การปรับแต่งหรือเทรน AI ที่ซับซ้อนมากขึ้นไม่ได้ทำให้ผลลัพธ์ของโมเดลดูเป็นมนุษย์มากขึ้นตามไปด้วย

ขนาดของโมเดลไม่ได้มีความสำคัญในการปรับแต่ง อย่าง โมเดล Llama 3.1 ขนาด 70,000 ล้านพารามิเตอร์กลับให้ผลที่ใกล้เคียงหรือบางครั้งก็แย่กว่าโมเดลขนาด 8,000 ล้านพารามิเตอร์ ซึ่งขัดกับสมมติฐานที่ว่าโมเดลที่ใหญ่กว่าจะมีความสมจริงมากกว่า หรือ โมเดลที่ผ่านการปรับแต่งให้ตอบตามคำสั่งของผู้ใช้ กลับมีประสิทธิภาพเลียนแบบมนุษย์ได้แย่กว่าโมเดลพื้นฐาน อย่าง Llama 3.1 8B และ Mistral 7B v0.1 ที่ไม่ได้ผ่านการ instruction-tuning กลับให้คำตอบที่มีความใกล้เคียง

ที่มา ARSTechnica