پژوهشگران آمریکایی از دیپ سیک تقلید کردند

پژوهشگران آمریکایی از دیپ سیک تقلید کردند

پارسی کاو: تعدادی از محققان دانشگاهی در آمریکا با اتکا بر مدل هوش مصنوعی دیپ سیک، قابلیت های اصلی این مدل را با هزینه ای 30 دلاری باز تولید کردند.


به گزارش پارسی کاو به نقل از گیزموچاینا، تحقیقات درباره ی هوش مصنوعی بطور معمول زمین بازی شرکت های بزرگ فناوری با بودجه های کلان است اما بعد از آنکه شرکت چینی دیپ سیک ادعا نمود با سرمایه ۶ میلیون دلاری یک مدل این فناوری را با قابلیت رقابت با چت جی پی تی توسعه داده، در بازار هیاهویی بوجود آمد. حال تعدادی از محققان دانشگاه «یوسی برکلی» قابلیت های اصلی مدل R۱-Zero دیپ سیک را با هزینه ۳۰ دلار تکرار کرده اند. این پروژه که «تاینی زیرو» نام گرفته، نشان میدهد برای توسعه مدلهای استدلالی پیشرفته هوش مصنوعی لزوما به هزینه های کلان نیاز نیست. البته باید به این نکته نیز اشاره نمود که هوش مصنوعی نیز بالاتر از پیش در دسترس قرار گرفته است. تعدادی از محققان به رهبری «جیای پان» تصمیم گرفتند مدل استدلالی دیپ سیک را با بهره گیری از فناوری «یادگیری تقویتی» (RL) بازسازی کنند. آنها بجای اتکا روی خدمات ابررایانشی یا قدرت رایانشی گرانقیمت، «تاینی زیرو» را با کمک یک مدل زبانی پایه، یک محرک و یک سیستم پاداش ساده آموزش دادند. پان در شبکه اجتماعی ایکس نوشت: شما می توانید خودتان لحظه «آها» (دستیابی به موفقیت) را با ۳۰ دلار تجربه کنید. او توضیح داد تاینی زیرو اولین بازتولید مدلهای استدلالی است که نشان دهنده قابلیت آنها برای تایید و اصلاح پاسخ هایشان است. پژوهشگران برای آزمایش مدل از یک بازی به نام «کانت داون» استفاده کردند که بازیکنان آن باید با بهره گیری از محاسبات پایه ریاضی به رقم مورد نظر دست یابند. هرچند تاینی زیرو در ابتدا بطور تصادفی پاسخ را حدس می زد، اما به گذر زمان آموخت پاسخ هایش را تایید کند، برای پاسخ های بهتر جستجو انجام دهد و بر طبق آن انطباقاتی انجام دهد. آنها در آزمایش هایشان از مدلهای هوش مصنوعی با اندازه مختلف از ۵۰۰ میلیون تا ۷ میلیارد پارامتر استفاده کردند نتایج نشان داد مدلهای کوچکتر بعد از حدس زدن پاسخ، متوقف می شدند. اما مدلهای بزرگ خودتاییدی، بهبود راهکار ها را آموختند و دقت را به میزان قابل توجهی زیاد کردند. تاینی زیرو یک مدل هوش مصنوعی منبع باز است و کاربران در گیت هاب می توانند به آن دسترسی یابند. هرچند این مدل هم اکنون فقط روی بازی کانت داون آزمایش شده اما پان امیدوار است این پروژه تحقیقات یادگیری تقویتی را بالاتر از پیش در دسترس قرار دهد.


منبع:

1403/11/14
10:15:14
5.0 / 5
26
تگهای خبر: آموزش , خدمات , شبكه , شركت
این مطلب را می پسندید؟
(1)
(0)

تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
لطفا شما هم نظر دهید
= ۷ بعلاوه ۳
ParsiKav