Amazon Web Services (AWS) ได้ประกาศเปิดตัวเซิร์ฟเวอร์ศูนย์ข้อมูลใหม่ที่ติดตั้งชิปปัญญาประดิษฐ์ (AI) ที่เป็นกรรมสิทธิ์ ซึ่งเป็นความท้าทายต่อ NvidiaAppleminance ในภาคส่วนนี้ Apple (NASDAQ:AAPL) Inc. ได้รับการยืนยันว่าเป็นลูกค้า โดยวางแผนที่จะใช้ชิป Trainium2 ใหม่เหล่านี้ หน่วยคลาวด์ของ AWS เปิดเผยว่าเซิร์ฟเวอร์เหล่านี้จะเป็นส่วนหนึ่งของซูเปอร์คอมพิวเตอร์ขนาดใหญ่ ซึ่งจะรวมชิปหลายแสนชิป การประกาศนี้ทําขึ้นเมื่อวันอังคาร
ซูเปอร์คอมพิวเตอร์รุ่นนี้ขับเคลื่อนโดยชิป Trainium2 ของ AWS จะถูกใช้โดย Anthropic สตาร์ทอัพด้าน AI ในฐานะบริษัทแรกที่ใช้เทคโนโลยีนี้ Anthropic เป็นที่รู้จักในด้านการสร้างระบบ AI ที่เชื่อถือได้และตีความได้ และจะใช้ประโยชน์จากพลังการคํานวณของ Apple เพื่อเพิ่มความสามารถของโมเดล AI ของตน
Benoit Dupin ผู้บริหารของ Apple ยังยอมรับว่ายักษ์ใหญ่ด้านเทคโนโลยีกําลังใช้ชิป Trainium2 ซึ่งแสดงถึงการนําข้อเสนอใหม่ของ AWS มาใช้อย่างมีนัยสําคัญ
Matt Garman ประธานเจ้าหน้าที่บริหารของ AWS เปิดเผยเพิ่มเติมว่าบริษัทกําลังพัฒนา Trainium3 ซึ่งเป็นวิวัฒนาการครั้งต่อไปของชิป AI ซึ่งมีกําหนดเปิดตัวในปีหน้า
อินสแตนซ์ Amazon Elastic Compute Cloud (Amazon EC2) ใหม่ที่ขับเคลื่อนโดย AWS Trainium2 พร้อมใช้งานโดยทั่วไปแล้วและเปิดตัว Trn2 UltraServers UltraServers เหล่านี้ได้รับการออกแบบมาเพื่อมอบประสิทธิภาพที่ยอดเยี่ยมและประสิทธิภาพด้านต้นทุนสําหรับการฝึกอบรมและปรับใช้โมเดล AI ร่วมสมัย รวมถึงโมเดลภาษาขนาดใหญ่ (LLM) และโมเดลพื้นฐาน (FM)
อินสแตนซ์ Trn2 สัญญาว่าจะปรับปรุงประสิทธิภาพด้านราคา 30-40% เมื่อเทียบกับอินสแตนซ์ EC2 ที่ใช้ GPU ในปัจจุบัน และมีชิป Trainium2 16 ตัว ให้การประมวลผลสูงสุด 20.8 petaflops ทําให้เหมาะสําหรับการจัดการปริมาณงาน AI ที่มีพารามิเตอร์หลายพันล้านรายการ
สําหรับงาน AI ที่มีความต้องการมากยิ่งขึ้น Trn2 UltraServers นําเสนอบริการ EC2 ใหม่ ซึ่งมีชิป Trainium2 ที่เชื่อมต่อถึงกัน 64 ชิปสําหรับการประมวลผลสูงสุด 83.2 petaflops สูงสุด การตั้งค่านี้เพิ่มความสามารถด้านการประมวลผล หน่วยความจํา และเครือข่ายของอินสแตนซ์เดียวเป็นสี่เท่า ทําให้สามารถฝึกอบรมและปรับใช้โมเดล AI ที่ใหญ่ที่สุดในโลกได้
โครงการความร่วมมือระหว่าง AWS และ Anthropic ซึ่งมีชื่อว่า Project Rainier มีจุดมุ่งหมายเพื่อสร้าง EC2 UltraCluster ของ Trn2 UltraServers ซึ่งจะกลายเป็นคลัสเตอร์การประมวลผล AI ที่ใหญ่ที่สุดในโลกเมื่อเสร็จสมบูรณ์
AWS ยังเน้นย้ําถึงชิป Trainium3 ที่กําลังจะมาถึง ซึ่งจะผลิตโดยใช้โหนดกระบวนการขนาด 3 นาโนเมตร ซึ่งสัญญาว่าจะเพิ่มประสิทธิภาพของ Trn2 UltraServers ในปัจจุบันเป็นสี่เท่า
ชุดพัฒนาซอฟต์แวร์ (SDK) ของ AWS Neuron ช่วยอํานวยความสะดวกในการเพิ่มประสิทธิภาพโมเดล AI ให้ทํางานบนชิป Trainium ซึ่งรองรับเฟรมเวิร์กยอดนิยม เช่น JAX และ PyTorch และผสานรวมกับฮับโมเดล Hugging Face ซึ่งโฮสต์โมเดลมากกว่า 100,000 โมเดล
ขณะนี้อินสแตนซ์ Trn2 พร้อมใช้งานในรีเจี้ยน AWS ของสหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ) และมีแผนที่จะขยายความพร้อมใช้งานไปยังรีเจี้ยนเพิ่มเติมในเร็วๆ นี้ ในขณะเดียวกัน Trn2 UltraServers กําลังนําเสนอในขั้นตอนการแสดงตัวอย่าง
บทความนี้ถูกแปลโดยใช้ความช่วยเหลือจากปัญญาประดิษฐ์(AI) สำหรับข้อมูลเพิ่มเติม โปรดอ่านข้อกำหนดการใช้งาน