Pengumuman yang dikeluarkan oleh Microsoft muncul lebih dari setahun setelah laporan internal mereka yang mengungkapkan bahwa perusahaan mulai mengembangkan model-model dasarnya sendiri.
Sebuah postingan di blog AI Microsoft mengungkap dua model AI mereka. Pertama, MAI-Voice-1 yang merupakan model pembangkit suara alami yang dirancang untuk menghasilkan audio ekspresif dengan fidelitas tinggi, baik untuk scenario satu pembicara maupun multi-pembicara.
Ide model ini adalah suara akan menjadi salah satu cara utama pengguna berinteraksi dengan perangkat AI di masa mendatang, meskipun sejauh ini belum melihatnya terwujud.
Model kedua adalah MAI-1-preview, merupakan model Bahasa besar fundamental yang dilatih khusus untuk menjalankan Copilot, alat chatbot AI Microsoft.
Model ini dilatih pada sekitar 15.000 GPU Nvidia H100 dan menjalankan referensi pada satu GPU. Model ini jauh lebih besar daripada model yang terlihat pada eksperimen Microsoft sebelumnya, yang berfokus pada model yang lebih kecil dan dirancang untuk berjalan secara lokal, seperti Phi-3.
Hingga saat ini, Copilot masih bergantung pada model-model OpenAI. Microsoft menginvestasikan sejumlah besar uang di OpenAI, kecil kemungkinan kedua perusahaan akan berpisah dalam waktu dekat.
Microsoft memperkenalkan model-model ini untuk menangani kasus penggunaan atau pertanyaan yang tidak menjadi fokus OpenAI. Kita melihat pergeseran bertahap dalam lanskap AI menuju model-model yang lebih terspesialisasi untuk tugas-tugas tertentu.
"Tujuannya adalah menciptakan sesuatu yang benar-benar berfungsi bagi konsumen... fokus saya adalah membangung model yang benar-benar berfungsi bagi pendamping konsumen," Mustafa Suleyman, pimpinan AI Microsoft, mengutip arsTechnica.
Masuk akal jika kita akan melihat model-model ini diluncurkan di Copilot, produk chatbot AI Microsoft yang berorientasi pada konsumen.
Pada postingan blog AI Microsoft, MAI-1 merupakan model yang dirancang untuk memberikan kemampuan canggih kepada konsumen yang ingin memanfaatkan model yang berfokus pada kepatuhan terhadap instruksi dan respons yang bermanfaat untuk pertanyaan sehari-hari.
MAI-Voice-1 sudah digunakan di fitur Copilot Daily dan Podcast Microsoft. Tersedia juga antarmuka Copilot Labs yang bisa dikunjungi untuk bereksperimen, memberikan perintah atau skrip, dan menyesuaikan jenis suara atau penyampaian yang ingin didengar.
Reporter: Muhamad Ardyansyah