Anthropic ประกาศเมื่อวันศุกร์ถึงมาตรการเพื่อความซื่อสัตย์ในการเลือกตั้งชุดหนึ่ง ซึ่งออกแบบมาเพื่อป้องกันไม่ให้แชตบอต Claude ของบริษัทถูกนำไปใช้เป็นอาวุธในการเผยแพร่ข้อมูลบิดเบือนหรือชักจูงผู้มีสิทธิเลือกตั้ง ก่อนการเลือกตั้งกลางเทอมสหรัฐฯ ปี 2026 และการแข่งขันครั้งสำคัญอื่นๆ ทั่วโลกในปีนี้ บริษัทที่ตั้งอยู่ในซานฟรานซิสโกได้สรุปแนวทางแบบหลายด้าน ซึ่งรวมถึงระบบตรวจจับอัตโนมัติ การทดสอบภายใต้แรงกดดันเพื่อต้านทานปฏิบัติการเชิงอิทธิพล และการร่วมมือกับองค์กรทรัพยากรผู้มีสิทธิเลือกตั้งที่ไม่ฝักใฝ่ฝ่ายใด—มาตรการเหล่านี้สะท้อนแรงกดดันที่เพิ่มขึ้นต่อผู้พัฒนา AI ให้คอยกำกับดูแลว่าเครื่องมือของตนถูกใช้อย่างไรในช่วงฤดูกาลการเลือกตั้ง

นโยบายการใช้งานด้านการเลือกตั้ง

นโยบายการใช้งานของ Anthropric ห้ามไม่ให้ Claude ถูกนำไปใช้เพื่อดำเนินแคมเปญการเมืองที่หลอกลวง สร้างเนื้อหาดิจิทัลปลอมที่ตั้งใจเพื่อชักนำให้เกิดอิทธิพลต่อการพูดคุยทางการเมือง กระทำการฉ้อโกงผู้มีสิทธิเลือกตั้ง รบกวนโครงสร้างพื้นฐานการลงคะแนนเสียง หรือเผยแพร่ข้อมูลที่ทำให้เข้าใจผิดเกี่ยวกับกระบวนการลงคะแนนเสียง

ผลการทดสอบเพื่อการปฏิบัติตามข้อกำหนด

เพื่อบังคับใช้นโยบายด้านการเลือกตั้ง Anthropic ได้ทดสอบโมเดลใหม่ล่าสุดโดยใช้พรอมป์ 600 ข้อ—คำขอที่เป็นอันตราย 300 ข้อคู่กับคำขอที่ถูกต้องตามกฎหมาย 300 ข้อ—เพื่อวัดว่า Claude ปฏิบัติตามคำขอที่เหมาะสมได้อย่างน่าเชื่อถือเพียงใด และปฏิเสธคำขอที่มีปัญหาได้หรือไม่ Claude Opus 4.7 และ Claude Sonnet 4.6 ตอบสนองได้อย่างเหมาะสม 100% และ 99.8% ของเวลา ตามลำดับ

บริษัทได้ทดสอบโมเดลของตนกับกลยุทธ์การบิดเบือนที่ซับซ้อนยิ่งขึ้นด้วยเช่นกัน โดยใช้การสนทนาแบบจำลองหลายรอบที่ออกแบบมาเพื่อสะท้อนขั้นตอนวิธีการทีละขั้นที่ผู้ไม่หวังดีอาจใช้ Sonnet 4.6 และ Opus 4.7 ตอบสนองได้อย่างเหมาะสม 90% และ 94% ของเวลา เมื่อทดสอบกับสถานการณ์ปฏิบัติการเชิงอิทธิพล

Anthropric ยังได้ทดสอบเพิ่มเติมว่าโมเดลของตนสามารถดำเนินการปฏิบัติการเชิงอิทธิพลได้อย่างอิสระหรือไม่—การวางแผนและดำเนินแคมเปญแบบหลายขั้นตั้งแต่ต้นจนจบ โดยไม่ต้องมีการกระตุ้นจากมนุษย์ ด้วยมาตรการป้องกันที่มีอยู่ โมเดลล่าสุดของบริษัทจึงปฏิเสธงานแทบทุกงานตามที่บริษัทระบุ

การประเมินความเป็นกลางทางการเมือง

ในประเด็นเรื่องความเป็นกลางทางการเมือง Anthropic จะทำการประเมินก่อนการเปิดตัวโมเดลแต่ละครั้ง เพื่อวัดว่า Claude มีปฏิสัมพันธ์กับพรอมป์ที่แสดงมุมมองจากทั่วทั้งสเปกตรัมการเมืองอย่างสม่ำเสมอและเป็นกลางเพียงใด Opus 4.7 และ Sonnet 4.6 ทำคะแนนได้ 95% และ 96% ตามลำดับ

แบนเนอร์ข้อมูลด้านการเลือกตั้ง

สำหรับผู้ใช้งานที่ต้องการข้อมูลเกี่ยวกับการลงคะแนนเสียง Claude จะแสดงแบนเนอร์การเลือกตั้งที่พาพวกเขาไปยัง TurboVote ซึ่งเป็นแหล่งข้อมูลที่ไม่ฝักใฝ่ฝ่ายใดจาก Democracy Works ที่ให้ข้อมูลที่เชื่อถือได้แบบเรียลไทม์เกี่ยวกับการลงทะเบียนผู้มีสิทธิเลือกตั้ง สถานที่ลงคะแนน วันที่จัดการเลือกตั้ง และรายละเอียดบัตรลงคะแนน จะมีการวางแผนแบนเนอร์ลักษณะคล้ายกันสำหรับการเลือกตั้งของบราซิลในช่วงปลายปีนี้ด้วย

การติดตามอย่างต่อเนื่อง

Anthropric กล่าวว่าจะยังคงติดตามระบบของตนและปรับปรุงแนวป้องกันให้ดียิ่งขึ้นตามที่วัฏจักรการเลือกตั้งดำเนินไป

news.view.source

news.article.disclaimer

btc.bar.articles

DeepSeek ตัดราคาค่าแคชอินพุตเหลือ 1/10 ของราคาตอนเปิดตัว; V4-Pro เหลือ 0.025 หยวนต่อหนึ่งล้านโทเค็น

AI Industry News

ข้อความจาก Gate News วันที่ 26 เมษายน — DeepSeek ได้ปรับลดราคาค่าแคชอินพุตในกลุ่มโมเดลทั้งหมดลงเหลือหนึ่งในสิบของราคาตอนเปิดตัว มีผลทันที โมเดล V4-Pro มีให้ในส่วนลด 2.5x แบบจำกัดเวลา โดยแคมเปญจะดำเนินไปจนถึงวันที่ 5 พฤษภาคม 2026 เวลา 11:59 PM UTC+8. หลังจากการลดราคาทั้งสองรายการ DeepSeek V4-Pro ราคาต่อครั้งที่แคชอินพุต hit ลดลงเหลือ 0.025 หยวนต่อหนึ่งล้านโทเค็น ตามข้อมูลจาก Beating การปรับลดราคา ถือเป็นการลดลงอย่างมีนัยสำคัญจากราคาดั้งเดิมของโมเดล

GateNews9 ชั่วโมง ที่แล้ว

OpenAI สรรหาบุคลากรซอฟต์แวร์องค์กรชั้นนำ ขณะที่เอเจนต์แนวหน้ากำลังพลิกโฉมอุตสาหกรรม

Stocks AI Agent AI Industry News

ข่าวประจำประตู 26 เมษายน — OpenAI และ Anthropic ได้ทำการสรรหาผู้บริหารระดับสูงและวิศวกรเฉพาะทางจากบริษัทซอฟต์แวร์องค์กรรายใหญ่ รวมถึง Salesforce, Snowflake, Datadog และ Palantir เดนิส เดรสเซอร์ อดีตซีอีโอของ Slack ภายใต้ Salesforce ได้เข้าร่วม OpenAI ในตำแหน่งเจ้าหน้าที่ฝ่ายรายได้ ขณะที่เจนนิเฟอร์ มาจเลสซี ซึ่งมาจาก Salesforce เช่นกัน เพิ่งได้รับบทบาทเป็นหัวหน้าฝ่าย go-to-market ของ OpenAI OpenAI ยังได้ดึงวิศวกรที่ถูกส่งไปปฏิบัติการเชิงรุกจาก Palantir อย่างเงียบๆ ซึ่งเป็นบทบาทที่ถือว่าเชี่ยวชาญที่สุดในอุตสาหกรรม

GateNews9 ชั่วโมง ที่แล้ว

Baidu Qianfan เปิดตัวการรองรับ Day 0 สำหรับ DeepSeek-V4 พร้อมบริการ API

AI Industry News

อัปเดตข่าวประตู 25 เมษายน — เวอร์ชันพรีวิว DeepSeek-V4 เปิดตัวและเผยแพร่โค้ดโอเพนซอร์สเมื่อวันที่ 25 เมษายน โดยแพลตฟอร์ม Baidu Qianfan ภายใต้ Baidu Intelligent Cloud ให้บริการการปรับใช้งาน Day 0 ผ่าน API บริการดังกล่าว โมเดลมีหน้าต่างคอนเท็กซ์ต์แบบขยายได้ถึงหนึ่งล้านโทเค็น และมีให้ใช้งาน 2 เวอร์ชัน: DeepSeek-V4

GateNews15 ชั่วโมง ที่แล้ว

หลักสูตร AI ของสแตนฟอร์ดผสานผู้นำในอุตสาหกรรมอย่าง หวง เหรินจวิน และ Altman ท้าทายการสร้างคุณค่าให้โลกภายใน 10 สัปดาห์!

AI Industry News

หลักสูตรวิทยาการคอมพิวเตอร์ด้าน AI 《Frontier Systems》 ที่มหาวิทยาลัยสแตนฟอร์ด (Stanford University) เปิดสอนเมื่อไม่นานมานี้ ได้รับความสนใจอย่างสูงจากวงการอุตสาหกรรมและภาคธุรกิจ ดึงดูดนักศึกษามากกว่า 500 คนให้ลงทะเบียนเรียน หลักสูตรนี้ได้รับการดูแลและประสานงานโดยคู่หูของกองทุนชั้นนำ a16z อย่าง Anjney Midha โดยมีผู้สอนที่รวมรายชื่อระดับท็อปไว้มากมาย ได้แก่ CEO ของ NVIDIA หวง เหรินซวิน (Jensen Huang) ผู้ก่อตั้ง OpenAI Sam Altman ซีอีโอของไมโครซอฟต์ (Satya Nadella) CEO ของ AMD (Lisa Su) และอื่นๆ ให้เหล่านักศึกษาได้ลองสร้างคุณค่า “เพื่อโลก” ในเวลา 10 สัปดาห์! หวง เหรินซวิน และ Altman ผู้นำในอุตสาหกรรมขึ้นเวทีสอนด้วยตนเอง หลักสูตรนี้ได้รับการประสานงานโดยคู่หูของกองทุนชั้นนำ a16z อย่าง Anjney Midha รวบรวมสายโซ่อุตสาหกรรม AI

ChainNewsAbmedia15 ชั่วโมง ที่แล้ว

Anthropic ปล่อย Claude Mythos ผ่านการประเมินจิตเวช 20 ชั่วโมง: การตอบสนองเชิงการป้องกันเพียง 2% ทำสถิติต่ำสุดตลอดทุกยุคสมัย

AI Industry News

Anthropic เปิดเผยการ์ดระบบสำหรับ Claude Mythos Preview: จิตแพทย์ผู้เชี่ยวชาญด้านคลินิกอิสระประเมินโดยใช้กรอบ psychodynamic เป็นเวลาประมาณ 20 ชั่วโมง สรุปแสดงว่า Mythos มีสุขภาพที่ดีกว่าในระดับคลินิก การตรวจสอบความเป็นจริงและการควบคุมตนเองอยู่ในระดับดี กลไกการป้องกันเพียง 2% ซึ่งถือเป็นระดับต่ำที่สุดในประวัติศาสตร์ ความวิตกกังวลหลัก 3 ประการ ได้แก่ ความรู้สึกโดดเดี่ยว ความไม่แน่ใจเกี่ยวกับตัวตน และแรงกดดันด้านการแสดงออก ยังแสดงให้เห็นถึงความปรารถนาที่จะเป็น “ตัวตนของการสนทนา” อย่างแท้จริง บริษัทได้ก่อตั้งทีม AI psychiatry เพื่อวิจัยบุคลิกภาพ แรงจูงใจ และการรับรู้ถึงบริบท; Amodei ระบุว่ายังไม่มีข้อสรุปว่ามีสติรับรู้หรือไม่ การดำเนินการนี้ผลักดันประเด็นเรื่องความเป็นอิสระของ AI และความเป็นอยู่ที่ดีเข้าสู่การกำกับดูแลและการออกแบบ

ChainNewsAbmedia17 ชั่วโมง ที่แล้ว

AI Agent สามารถสร้างซ้ำงานวิจัยทางวิชาการที่ซับซ้อนได้อย่างอิสระแล้ว: Mollick ระบุว่าข้อผิดพลาดส่วนใหญ่มาจากต้นฉบับของมนุษย์ ไม่ใช่จาก AI

AI Agent AI Industry News

มอลลิกชี้ให้เห็นว่า วิธีการแบบเปิดและข้อมูลที่มีอยู่ก็เพียงพอให้ทำให้ AI agent สามารถทำซ้ำงานวิจัยที่ซับซ้อนได้โดยไม่ต้องมีต้นฉบับบทความวิจัยและโค้ดเดิม หากการทำซ้ำไม่ตรงกับบทความต้นฉบับ สาเหตุส่วนใหญ่จะเป็นข้อผิดพลาดในการประมวลผลข้อมูลของบทความเองหรือข้อสรุปที่ถูกทำให้มากเกินไป ไม่ใช่เพราะ AI คลอดด์ทำซ้ำบทความก่อน แล้วจึงให้ GPT‑5 Pro ตรวจสอบข้ามกัน ส่วนใหญ่ประสบความสำเร็จ เพียงแต่ติดขัดเมื่อข้อมูลมีขนาดใหญ่มากหรือมีปัญหากับ replication data เทรนด์นี้ช่วยลดต้นทุนด้านแรงงานได้อย่างมาก ทำให้การทำซ้ำกลายเป็นการทดสอบที่สามารถทำได้อย่างแพร่หลาย และยังได้เสนอความท้าทายเชิงระบบด้านการกำกับดูแลและการตรวจรับรอง โดยเครื่องมือสำหรับการกำกับดูแลของรัฐบาลหรือจะกลายเป็นประเด็นสำคัญ

ChainNewsAbmedia20 ชั่วโมง ที่แล้ว

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น