یک مدل زبانی بزرگ فارسی با ۸ میلیارد پارامتر به صورت منبع باز معرفی شد
مرکز تحقیقات هوش مصنوعی پارت یک مدل بزرگ زبانی (LLMs) فارسی با ۸ میلیارد پارامتر را به صورت منبع باز منتشر کرد.
به گزارش پیوست به نقل از روابط عمومی پارت، یکی از مدل های ۸ میلیارد پارامتری این شرکت که متعلق به گروه مدلهای زبانی درنا است بهصورت متن باز در دسترس اکوسیستم هوش مصنوعی کشور قرار گرفت. این مدل با استفاده از کلان دادههای زبان فارسی آموزش دیده و به صورت رایگان و متنباز توسط عموم توسعهدهندگان و کسبوکارهای حوزه هوش مصنوعی قابل دریافت است.
در این مدل زبانی بزرگ ۸ میلیارد پارامتری از فناوریهای جدید استفاده شده که باعث میشود در مقایسه با برخی مدلهای بزرگتر از خود، کارکرد بهتری داشته باشد و عملکردی دقیقتر از تمامی مدلهای فارسی منتشرشده تا به امروز به ثبت برساند. این مدل درنا، نمره کلی بهتری در ارزیابی و مقایسه با مدلهایی همچون Meta Llama 3 کسب کرده است و به طور چشمگیری در تعاملات زبان بومی و پس زمینههای فرهنگی ایرانی و فارسی، عملکرد بهتری نسبت به مشابه های خارجی دارد.
خلاصهسازی متون، کدنویسی، تشخیص احساسات، پاسخ به سؤالات طولانی، پرسش و پاسخهای بله و خیر، پاسخ به سؤالات عمومی، تاریخی، ریاضی، اخبار و غیره تنها بخشی از توانمندیهای این مدل بزرگ زبانی است و بهتدریج با افزایش کاربران و اعمال بازخوردهای دریافتی، عملکرد بخشهای مختلف این مدل نیز به طور مداوم بهبود پیدا میکند.
مرکز تحقیقات هوش مصنوعی پارت این امکان را برای کسبوکارها، توسعهدهندگان و محققان فراهم کرده که این مدل متنباز درنا را بر پایه دادههای خود شخصیسازی یا به اصطلاح Fine-tune کنند و ویژگیهای گوناگونی را متناسب با کسبوکار و اهداف خود به مدل نهایی خود بیفزایند. علاوه بر این، پارت برای اولین بار در ایران، از این مدل زبانی بزرگ روی سرورهای هاگینگ فیس میزبانی میکند، تا کاربران بدون نیاز به زیرساخت یا سختافزار، به صورت رایگان این LLM هشت میلیارد پارامتری را در این سایت تست و آزمایش کنند.
مرکز تحقیقات هوش مصنوعی پارت در چند ماه گذشته، با معرفی گروه مدل بزرگ زبانی درنا و مدل زبانی توکا، در راستای هدف خود برای رشد و گسترش زیستبوم نوآوری و هوش مصنوعی فارسی گام برداشته است.
بسیاری از LLMهای مطرح دنیا که بهصورت منبعباز ارائه شدهاند، بر پایه زبان انگلیسی، زبانهای برنامهنویسی و برخی از زبانهای پرکاربرد جهانی آموزش دیدهاند و بهترین عملکرد خود را در چنین زبانهایی به نمایش میگذارند. این در حالی است که بسیاری از زبانهای زنده و محبوب مانند فارسی توسط LLMها پشتیبانی نمیشوند یا در صورت پشتیبانی، با ایرادات بسیاری همراه هستند. در چنین موقعیتی، اهمیت مدلهایی مانند درنا که با تمرکز حداکثری بر زبان فارسی توسعه پیدا کردهاند، بیشازپیش خودنمایی میکند.
شما میتوانید با مراجعه به لینک زیر، آخرین نسخه از این مدل زبانی را دریافت و آن را به صورت رایگان، تست و ارزیابی کنید: