رونمایی از کلان پیکره زبان فارسی با ۳۵ میلیارد کلمه

به گزارش ابرنت، کلان پیکره زبان فارسی، بزرگترین مجموعه دادگان شامل ۳۵ میلیارد کلمه در همایش الزامات توسعه مدل زبانی بزرگ فارسی رونمایی گردید.

به گزارش ابرنت به نقل از معاونت علمی، فناوری و اقتصاد دانش بنیان ریاست جمهوری، همایش الزامات توسعه مدل زبانی بزرگ فارسی با عنوان «هوش مصنوعی مولد قدرت حکومت ها» به همت ستاد توسعه فناوری های هوش مصنوعی و رباتیک معاونت علمی ریاست جمهوری در پژوهشگاه ارتباطات و فناوری اطلاعات(ایرانداک) برگزار گردید.
در این نشست، کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوری های هوش مصنوعی و رباتیک و توسعه داده شده توسط یکی از شرکتهای فناور رونمایی گردید.
این کلان پیکره با آزادرسانی به صورت open source با تنوع بالا و حفظ بافتار متن در دسترس عموم قرار خواهد گرفت.
«مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکه های عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان استفاده می نماید.
هوش مصنوعی مولد در یک سال گذشته بیشترین پیشرفت را به خود اختصاص داده و عمده سهم این پیشرفت متکی به مدلهای زبانی بزرگ(LLM ها) بوده است.
مدل های زبان بزرگ یک نوع از مدلهای هوش مصنوعی است که توانایی پردازش اطلاعات چندجانبه را دارند. این مدلها از قدرت بی نظیر خود در پردازش زبان برای ایجاد پاسخ های بهینه تر و بهتر به سوالات مختلف کاربران استفاده می نمایند. هم اکنون، طراحی و مهندسی دستورالعمل های بهینه برای این مدلها از اهمیت زیادی برخوردار می باشد و تیم های پژوهشی در دانشگاه ها و مراکز تحقیقاتی مختلف به این مورد توجه ویژه ای دارند.

منبع: abrnet.ir

1402/12/21

14:56:12

0.0 / 5

190

تگهای خبر: ارتباطات , شبكه , طراحی , فناوری

این مطلب را می پسندید؟

(0)

تازه ترین مطالب مرتبط

نظرات بینندگان در مورد این مطلب

لطفا شما هم در مورد این مطلب نظر دهید

= ۸ بعلاوه ۱

ارسال نظر