All posts tagged in LLM

3Articles
Typhoon OCR

AI2 days ago

Typhoon โมเดล LLM ของไทยที่พัฒนาโดย SCB10X เปิดตัวฟีเจอร์ใหม่ Typhoon OCR เอา AI มาช่วยดึงข้อมูลจากเอกสาร รองรับ รูปภาพ ตาราง ลายมือ รองรับทั้งไทย-อังกฤษ เทคโนโลยี OCR แบบเดิมนั้นจะใช้ Convolutional Neural Networks (CNNs) ทำงานร่วมกับ RNNs หรือ Transformers แปลงภาพเป็นข้อความ แต่ก็มีข้อจำกัดหลายอย่าง ทาง

AI2 weeks ago

อาลีบาบา คลาวด์ (Alibaba Cloud) เปิดตัว Qwen3 โมเดลภาษาขนาดใหญ่ (Large Language Model – LLM) แบบโอเพ่นซอร์สเจเนอเรชันล่าสุด พร้อมสร้างมาตรฐานใหม่ด้วยความสามารถ “Hybrid Reasoning” หรือการใช้เหตุผลแบบผสมผสาน ที่ออกแบบมาเพื่อให้นักพัฒนาสามารถสร้างแอปพลิเคชันยุคหน้าได้อย่างยืดหยุ่นและทรงพลัง ซีรีส์ Qwen3 ประกอบด้วยโมเดลหลากหลายขนาด ตั้งแต่โมเดลขนาดเล็กสำหรับอุปกรณ์พกพาไปจนถึงโมเดลขนาดใหญ่ระดับหลายแสนล้านพารามิเตอร์ โดยมีทั้ง dense model 6 รุ่น (ตั้งแต่ 0.6B ถึง

AI1 month ago

เมื่อวันที่ 5 เมษายน 2025 Meta ประกาศเปิดตัว Llama 4 โมเดลภาษาขนาดใหญ่ (LLM) รุ่นใหม่ล่าสุดในตระกูล Llama ชูจุดเด่นคือการเป็นโมเดลแบบ multimodal อย่างแท้จริงที่สามารถเข้าใจและประมวลผลข้อมูลได้หลากหลายรูปแบบ ไม่ใช่แค่เพียงข้อความเท่านั้น Llama 4 เปิดตัวพร้อมกันสองรุ่นหลัก ได้แก่ สถาปัตยกรรมใหม่ของ Llama 4 สิ่งที่น่าสนใจคือ Llama 4 ทั้งสองรุ่นถูกพัฒนาด้วยสถาปัตยกรรมแบบ “Mixture-of-Experts” (MoE) ซึ่งทำให้โมเดลมีความฉลาดและมีประสิทธิภาพมากขึ้น

Advertisement

Sidebar Search
Popular Now
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...