Yandex Research, Yüksek Lisans'ları sıkıştırmak için yeni yöntemler geliştirerek yapay zeka uygulama maliyetlerini 8 kata kadar azalttı – TEKNOLOJİ

admin • 24.07.2024 02:30

Yandex Araştırma ekibi, IST Avusturya, NeuralMagic ve KAUST'tan araştırmacılarla işbirliği içinde, büyük dil modelleri için iki yeni sıkıştırma yöntemi geliştirdi: Dil Modelleri için Eklemeli Niceleme (AQLM) ve PV-Tuning. Bu yöntemler birleştirildiğinde, %95 yanıt kalitesini korurken model boyutunda 8 kata kadar azalma sağlar. Kaynakları optimize etmeyi ve büyük dil modellerini çalıştırmada verimliliği artırmayı amaçlayan bu yeni yaklaşımı detaylandıran makale, şu anda Avusturya'nın Viyana kentinde düzenlenen Uluslararası Makine Öğrenimi Konferansında (ICML) sunuldu.

AQLM ve PV-Tuning'in ana özellikleri

AQLM, LLM sıkıştırması için bilgi alımında geleneksel olarak kullanılan toplamsal niceleme yöntemini kullanır. Ortaya çıkan yöntem, aşırı sıkıştırma altında model doğruluğunu korur ve geliştirir, böylece LLM'nin ev bilgisayarları gibi günlük cihazlara uygulanmasını mümkün kılar. Bu, bellek tüketiminde önemli bir azalmaya neden olur. PV-Tuning, model sıkıştırma işlemi sırasında oluşabilecek hataları ortadan kaldırır. AQLM ve PV-Tuning birleştirildiğinde, sınırlı bilgi işlem kaynaklarıyla bile yüksek kaliteli yanıtlar sağlayabilen kompakt bir modelde en iyi sonuçları sağlar.

Yöntemin değerlendirilmesi ve tanınması

Sunulan yöntemlerin etkinliği, LLama 2, Mistral ve Mixtral gibi popüler açık kaynaklı modeller kullanılarak titizlikle değerlendirilmiştir. Araştırmacılar bu büyük dil modellerini sıkıştırdılar ve yanıt kalitesini İngilizce WikiText2 ve C4 kriterlerine göre değerlendirdiler. Modeller 8 kedi ezilmesine rağmen Etkileyici bir %95 Yanıtın kalitesini korumayı başardı.

AQLM ve PV-Tuning'den kimler yararlanabilir?

Yeni yöntemler, özel dil modelleri ve açık kaynaklı LLM'ler geliştiren ve dağıtan şirketler için önemli kaynak tasarrufu sağlıyor. Örneğin sıkıştırma sonrasında 13 milyar parametreye sahip olan Llama 2 modeli artık 4 yerine sadece 1 GPU üzerinde çalışarak donanım maliyetlerini 8 kata kadar azaltıyor. Bu, startup'ların, bireysel araştırmacıların ve LLM meraklılarının her gün kullandıkları bilgisayarlarda Llama gibi gelişmiş LLM'leri çalıştırabilecekleri anlamına gelir.

Yeni LLM uygulamalarını keşfedin

AQLM ve PV-Tuning, modellerin sınırlı hesaplama kaynaklarına sahip cihazlara çevrimdışı olarak dağıtılmasına olanak tanıyarak akıllı telefonlar, akıllı hoparlörler ve daha fazlası için yeni kullanımlara olanak tanır. Bu cihazlara yerleşik gelişmiş LLM'ler sayesinde kullanıcılar, aktif bir İnternet bağlantısına ihtiyaç duymadan metin ve resim oluşturmayı, sesli yardımı, kişiselleştirilmiş önerileri ve hatta gerçek zamanlı dil çevirisini kullanabilirler. Ek olarak, bu yöntemler kullanılarak sıkıştırılan modeller daha az hesaplama gerektirir. 4 kata kadar daha hızlı işe yarayabilir.

Uygulama ve erişim

Dünyanın dört bir yanındaki geliştiriciler ve araştırmacılar GitHub'da bulunan AQLM ve PV-Tuning'i kullanabilir. Geliştiriciler tarafından sağlanan tanıtım materyalleri, çeşitli uygulamalar için sıkıştırılmış LLM'lerin etkili bir şekilde eğitilmesi için rehberlik sunar. Ek olarak, geliştiriciler bu yöntemleri kullanarak sıkıştırılmış popüler açık kaynak şablonlarını indirebilirler.

ICML'de sunuldu

Yandex Research'ün AQLM sıkıştırma yöntemine ilişkin bilimsel makalesi, dünyanın en prestijli makine öğrenimi konferanslarından biri olan ICML'de yayınlandı. IST Avusturya'dan araştırmacılar ve yapay zeka girişimi Neural Magic'ten uzmanlarla birlikte hazırlanan bu çalışma, LLM sıkıştırma teknolojisinde önemli bir ilerlemeyi temsil ediyor. Kaynak: (guzelhaber.net) Güzel Haber Masası

—–Sponsorlu Bağlantılar—–

Yandex Research, Yüksek Lisans'ları sıkıştırmak için yeni yöntemler geliştirerek yapay zeka uygulama maliyetlerini 8 kata kadar azalttı – TEKNOLOJİ

AQLM ve PV-Tuning'in ana özellikleri

Yöntemin değerlendirilmesi ve tanınması

AQLM ve PV-Tuning'den kimler yararlanabilir?

Yeni LLM uygulamalarını keşfedin

Uygulama ve erişim

ICML'de sunuldu

Bir yanıt yazın Yanıtı iptal et

Kyle Walker’dan Dünya Kupası Öncesi Milli Takım Açıklaması!

Kadim Çelik Zanaatının Zirve Temsili Nadir Pusat Koleksiyonları

Serebral Palsi’nin Ortopedik Etkileri: Bu 5 Belirtiyi Göz Ardı Etmeyin!

Yeni Volvo EX60: 810 km Menzil Vaadiyle Tanıtıldı

Fenerbahçe, Samsunspor karşılaşması için son hazırlıklarını yaptı

Hakan Fidan, İran’da Altı Dışişleri Bakanı ile Bir Araya Geldi

Pişmanlıkla Gelen Ceza: 16 Bin Lira 200 Bin Liraya Çıktı

Elon Musk: ‘Tesla Model Y, en çok tercih edilen otomobil oldu’

Emekli zam farkları 2026: 3119 TL ödemeleri ne zaman yapılacak?

Otizmin Önlenmesi Mümkün Mü? Bilim İnsanları 1300 Günün Önemine Dikkat Çekiyor!

Tekdez Kurumsal

Beyaz Eşya Servisi İzmir

Seferihisar Teknik Servisi

Egemer Mermer Granit

Bossy Digital

AQLM ve PV-Tuning'in ana özellikleri

Yöntemin değerlendirilmesi ve tanınması

AQLM ve PV-Tuning'den kimler yararlanabilir?

Yeni LLM uygulamalarını keşfedin

Uygulama ve erişim

ICML'de sunuldu

Tavsiye Edilen Haberler

Kimlik fotokopisini yok etmeyenler için ceza geliyor

Estudiantes, Fernando Muslera’nın iki penaltı kurtarışıyla şampiyonluğa ulaştı

Kışın Cilt Koruma İpuçları: Avokado Maskesiyle Güçlendirin

Bir yanıt yazın Yanıtı iptal et