صنعت با ارائه 51 مدل یادگیری ماشینی از دانشگاه پیشی گرفت| فرهیختگان آنلاین

دسترسی سریع

خبرهای روزنامه فرهیختگان اخبار این صفحه

صنعت با ارائه 51 مدل یادگیری ماشینی از دانشگاه پیشی گرفت

مهم‌ترین تصمیمات اجلاس گروه کشوری معماری و شهرسازی چه بود؟

خبرهای روزنامه فرهیختگان روزنامه فرهیختگان

خبرهای روزنامه فرهیختگان ورزشی

خبرهای روزنامه فرهیختگان دانشگاه

شماره ۴۱۳۸ | صفحه 4 | دانشگاه

در بررسی تحقیق و توسعه هوش مصنوعی مطرح شد

صنعت با ارائه 51 مدل یادگیری ماشینی از دانشگاه پیشی گرفت

ندا اظهری، مترجم: در هفتمین گزارش شاخص هوش مصنوعی 2024 که از سوی موسسه «هوش مصنوعی انسان‌محور» دانشگاه استنفورد منتشر شده، شاخص 2024 جامع‌ترین شاخص منتشر‌شده تا امروز است و در آن، تاثیر هوش مصنوعی بر جامعه به طور مبسوط اشاره شده است. امسال، محققان این موسسه در گزارشی که ارائه کرده‌اند دامنه مطالعات خود را گسترش داده‌اند تا روندهای اساسی مانند پیشرفت‌های فنی در هوش مصنوعی، درک عمومی از فناوری و پویایی ژئوپلیتیکی پیرامون توسعه آن را پوشش دهند. این نسخه از گزارش با ارائه داده‌های اصلی‌تر نسبت به سایر گزارش‌ها، برآوردهای جدیدی را در مورد هزینه‌های آموزش هوش مصنوعی، تجزیه و تحلیل دقیق چشم‌انداز هوش مصنوعی مسئول، و فضای کاملا جدیدی را، معرفی می‌کند که به تاثیر هوش مصنوعی بر علم و پزشکی اختصاص دارد. این گزارش، داده‌های مرتبط با هوش مصنوعی را ردیابی، گردآوری، خلاصه و تجسم می‌کند. ماموریت محققان از پیشبرد این گزارش، ارائه داده‌های بی‌طرفانه و بررسی دقیق براساس منابع گسترده است تا سیاست‌گذاران، محققان، مدیران اجرایی، روزنامه‌نگاران و عموم مردم بتوانند درک دقیق‌تری از حوزه پیچیده هوش مصنوعی ایجاد کنند. شاخص هوش مصنوعی در سطح جهانی به عنوان یکی از معتبرترین منابع برای داده‌ها و بینش درمورد هوش مصنوعی شناخته شده است. نسخه‌های پیشین که در روزنامه‌های بزرگ از جمله نیویورک‌تایمز، بلومبرگ و گاردین ذکر شده‌اند، صدها نقل قول دانشگاهی را جمع‌آوری کرده و توسط سیاست‌گذاران سطح بالا در آمریکا، انگلیس و اتحادیه اروپا ارجاع داده شده است. نسخه امسال از نظر ابعاد، مقیاس و دامنه از تمام نسخه‌های قبلی پیشی گرفته است که نشان‌دهنده رشد روزافزون و حائز اهمیتی است که هوش مصنوعی در زندگی همه ما دارد. بخش نخست گزارش شاخص هوش مصنوعی 2024 به بررسی تحقیق و توسعه در هوش مصنوعی می‌پردازد که با ارزیابی مقالات و پتنت‌ها در حوزه هوش مصنوعی آغاز و به بررسی سیستم‌های شاخص هوش مصنوعی و مدل‌های پایه در این حوزه می‌رسد.

رشد 3برابری مقالات هوش مصنوعی در بازه 12ساله

طبق آماری که تعداد مقالات انگلیسی و چینی زبان را بین سال‌های 2010 تا 2022 نشان می‌دهد، تعداد کل مقالات در حوزه هوش مصنوعی حدودا سه برابر شده به طوری که تعداد آن از حدود 88 هزار مقاله در سال 2010 به بیش از 240 هزار مقاله در سال 2022 رسید. این افزایش در سال گذشته در حدود 1.1 درصد بوده است. در سال 2022، حدود 230 هزار مقاله ژورنالی در مقایسه با 42 هزار مقاله ارسال کنفرانسی به ثبت رسید. از سال 2015، مقالات ژورنالی و کنفرانسی پیرامون هوش مصنوعی با نرخ‌های قابل مقایسه افزایش یافته است. در سال 2022، تعداد مقالات کنفرانسی حدود 2.6 برابر سال 2015 و تعداد مقالات ژورنالی 2.4 برابر همان سال بوده است. علاوه براین، بررسی‌هایی که روی مقالات هوش مصنوعی براساس رشته تحصیلی از سال 2010 انجام شده، نشان می‌دهد که مقالات در حوزه یادگیری ماشینی بیشترین رشد را طی یک دهه گذشته داشته به طوری که از سال 2015 تاکنون با رشد 7 برابری روبه‌رو بوده است. به دنبال آن، بیشترین مقالات منتشر‌شده پیرامون هوش مصنوعی را مقالات در حوزه دید کامپیوتری با 21309 مقاله به خود اختصاص داده است. پس از آن هم، رشته‌های تشخیص الگو با 19841 مقاله و مدیریت فرآیند با 12052 مقاله در رده‌های بعدی قرار گرفته‌اند. بررسی دیگری که در این گزارش به آن پرداخته شده، توزیع مقالات هوش مصنوعی براساس گروه یا بخشی است که مقالات به واسطه آنها منتشر می‌شود و به چند بخش آموزشی، دولتی، صنعتی، غیرانتفاعی و... تقسیم می‌شوند. این مطالعه به بررسی مقالات این بخش‌ها در آمریکا، چین، انگلیس و اتحادیه اروپا اشاره کرده است. طبق این آمار، در سال 2022، بخش دانشگاهی بیشتر مقالات هوش مصنوعی (حدود 81.1 درصد) را به خود اختصاص داد و موقعیت خود را به عنوان منبع جهانی پیشرو در تحقیقات هوش مصنوعی در یک دهه گذشته در تمام مناطق حفظ کرد. مشارکت بخش صنعتی با سهم حدود 8 درصدی، در آمریکا و پس از آن در اتحادیه اروپا به علاوه انگلیس و چین بیشترین اهمیت را دارد.

مرزهای پژوهشی هوش مصنوعی

در بخش دیگری از گزارش شاخص هوش مصنوعی 2024، به بررسی مرزهای پژوهشی هوش مصنوعی پرداخته شده است. در حالی که بسیاری از مدل‌های جدید هوش مصنوعی سالانه معرفی می‌شوند، تنها یک نمونه کوچک نشان‌دهنده پیشرفته‌ترین پژوهش‌هاست. به طور قطع، آنچه پژوهش‌های پیشرفته یا مرزی را تشکیل می‌دهد تا حد زیادی ذهنی است. شاخص هوش مصنوعی، فرآیندها را در دو نوع هوش مصنوعی مرزی مطالعه می‌کند؛ یکی «مدل‌های شاخص» و دیگری «مدل‌های پایه». Epoch که ارائه‌دهنده داده‌های شاخص هوش مصنوع است، از اصطلاح «مدل‌های یادگیری ماشینی شاخص» استفاده می‌کند تا مدل‌های شاخصی را مشخص کند که به ویژه در اکوسیستم یادگیری ماشینی/هوش‌مصنوعی تاثیرگذار است. به عنوان نمونه‌هایی از مدل‌های پایه، می‌توان به GPT-4، Claude 3 و Gemini اشاره کرد.
صنعت در ارائه مدل‌های یادگیری ماشینی از دانشگاه پیش افتاد
هوش مصنوعی Epoch گروهی از محققان را دربرمی‌گیرد که خود را وقف مطالعه و پیش‌بینی تحول هوش مصنوعی پیشرفته کرده‌اند و داده‌هایی را از هوش مصنوعی و مدل‌های یادگیری ماشینی از دهه 1950 ارائه داده‌اند. تجزیه‌وتحلیل این مدل‌ها، یک نمای کلی جامع از تحول چشم‌انداز یادگیری ماشینی، هم در سال‌های اخیر و هم در چند دهه گذشته ارائه می‌کند. تا سال 2014، دانشگاه‌ها در عرضه مدل‌های یادگیری ماشینی پیشرو بودند. از آن زمان به بعد، صنعت در این حوزه پیش افتاد و از دانشگاه‌ها جلو افتاد. در سال 2023، حدود 51 مدل یادگیری ماشینی توسط صنعت تولید شد که در مقایسه با 15 مدل، رشد قابل توجهی را نسبت به دانشگاه نشان می‌دهد. ظهور 21 مدل شاخص به دنبال همکاری صنعت و دانشگاه در سال 2023 یک رکورد جدید را به ثبت رساند. ایجاد مدل‌های پیشرفته هوش مصنوع در حال حاضر به مقدار قابل توجهی داده، قدرت محاسباتی و منابع مالی نیاز دارد که در دانشگاه‌ها در دسترس نیستند. این تغییر به سمت افزایش تسلط بخش صنعتی در مدل‌های پیشرو هوش مصنوعی نخستین بار در گزارش شاخص هوش مصنوعی در سال گذشته برجسته شد. اگرچه امسال این شکاف اندکی کاهش یافته اما این روند تا حد زیادی ادامه دارد.
آمریکا نخستین تولیدکننده مدل‌های یادگیری ماشینی در دنیا
در سال 2023، آمریکا با 61 مدل شاخص یادگیری ماشینی رتبه نخست دنیا را از آن خود کرد. پس از آن هم چین با 15 مدل و فرانسه با 8 مدل رده‌های دوم و سوم را کسب کردند. از سال 2019، اتحادیه اروپا و انگلیس با یکدیگر، در تعداد مدل‌های شاخص هوش مصنوعی تولید شده از چین پیشی گرفتند. از سال 2003، آمریکا در مقایسه با سایر کشورهای مهم از قبیل انگلیس، چین و کانادا مدل‌های بیشتری تولید کرده است.

پتنت‌های هوش مصنوعی در یک سال 62.7 درصد رشد کردند

در بررسی رشد جهانی اختراعات و پتنت‌های گرنت‌شده در حوزه هوش مصنوعی از سال 2010 تا 2022، در یک دهه گذشته، افزایش قابل‌توجهی در تعداد پتنت‌های هوش مصنوعی و ثبت اختراع‌ها مشاهده شده است. به عنوان مثال، بین سال‌های 2010 تا 2014، رشد کل اختراعات و پتنت‌های گرنت‌شده در حوزه هوش مصنوعی 56.1 درصد بوده است. باوجوداین، تنها از سال 2021 تا 2022، تعداد کل پتنت‌های هوش مصنوعی 62.7 درصد افزایش یافته است. در تفکیک پتنت‌ها به دو بخش گرنت‌شده و گرنت‌نشده، در سال 2022، تعداد پتنت‌های گرنت‌نشده در زمینه هوش مصنوعی به 128 هزار و 952 مورد رسید که بیش از دو برابر میزان پتنت‌های گرنت‌شده بوده است. با گذشت زمان، چشم‌انداز تاییدیه‌های پتنت‌های هوش مصنوعی به طور قابل توجهی تغییر کرده است. تا سال 2015، نسبت بیشتری از پتنت‌ها در حوزه هوش مصنوعی ثبت شده بود. باوجوداین، بیشتر پرونده‌های ثبت اختراع هوش مصنوعی گرنتی دریافت نکرده‌اند که این شکاف به طور قابل توجهی افزایش یافته است. به عنوان مثال، در سال 2015، قریب به 42.2 درصد از کل پتنت‌های ثبت‌شده در حوزه هوش مصنوعی گرنتی دریافت نکرده‌اند که تا سال 2022، این رقم به 67.4 درصد رسید. شکاف پتنت‌های هوش مصنوعی گرنت‌شده و گرنت‌نشده در تمام نقاط جغرافیایی شامل چین، اتحادیه اروپا، انگلیس و اروپا مشهود است. در سال‌های اخیر، هر سه نقطه جغرافیایی هم در تعداد کل پتنت‌های هوش مصنوعی و هم در تعداد پتنت‌های اعطا‌شده افزایش یافته است. در بررسی تفکیک منطقه‌ای اختراعات گرنت‌شده هوش مصنوعی، از سال 2022، بخش عمده‌ای از پتنت‌های گرنت‌شده که 75.2 درصد را شامل می‌شد، از شرق آسیا و اقیانوس آرام سرچشمه می‌گیرد و آمریکای شمالی با 21.2 درصد، بزرگ‌ترین مشارکت‌کننده بعدی محسوب می‌شود. تا سال 2011، آمریکای شمالی در تعداد پتنت‌های جهانی هوش مصنوعی پیشتاز بوده است. با وجوداین، از آن زمان تاکنون، تغییر قابل‌توجهی به سمت افزایش تعداد پتنت‌های هوش مصنوعی از شرق آسیا و اقیانوس آرام صورت گرفته است. به لحاظ تفکیک کشورها، بیشتر پتنت‌های گرنت‌شده هوش مصنوعی در دنیا را چین با سهم 61.1 درصدی از آن خود کرده است و پس از آن نیز آمریکا با سهم 20.9 درصدی در رده دوم قرار گرفته است که در مقایسه با سهم 54.1 درصدی آمریکا در سال 2010، روند کاهشی را نشان می‌دهد.

65.8 درصد مدل‌های پایه هوش مصنوعی دسترسی آزاد دارند

مدل‌های پایه، دسته‌بندی سریع و محبوبی از مدل‌های هوش مصنوعی را نشان می‌دهند. این قبیل مدل‌ها که روی مجموعه داده‌های گسترده آموزش دیده‌اند، همه‌کاره بوده و برای کاربردهای پایین‌دستی مناسب هستند. مدل‌های پایه مانند GPT-4، Claude3 و Llama2 توانایی‌های قابل توجهی را به نمایش می‌گذارند و به‌طور فزاینده‌ای در سناریوهای دنیای واقعی به کار گرفته می‌شوند. نمودارهای اکوسیستم که در سال 2023 معرفی شد، یک ابتکار اجتماعی جدید از دانشگاه استنفورد است که اکوسیستم مدل پایه، ازجمله مجموعه داده‌ها، مدل‌ها و برنامه‌ها را ردیابی می‌کند. این بخش از داده‌های نمودارهای اکوسیستم برای مطالعه روند مدل‌های پایه در طول زمان مورد استفاده قرار می‌گیرند. به‌طور کلی مدل‌های پایه به روش‌های مختلفی قابلیت دسترسی دارند. هیچ مدل دسترسی مانند PaLM-E گوگل فقط برای توسعه‌دهندگان آن قابل دسترسی نیست. مدل‌های دیگر هم مدل‌های دسترسی محدود مانند GPT-4 شرکت OpenAI؛ و دسترسی محدودی به مدل‌ها هستند که اغلب از طریق یک API (واسط برنامه‌نویسی کاربردی) عمومی ارائه می‌دهند. مدل‌های باز مانند Llama2 شرکت «متا» نیز وزن‌های مدل را کاملا آزاد می‌کنند به این معنی که مدل‌ها را می‌توان تغییر داد و آزادانه استفاده کرد. در سال‌های اخیر، تعداد مدل‌های پایه به‌شدت افزایش یافته است به‌طوری‌که این تعداد، از سال 2022 بیش از دو برابر شده و از سال 2019 تقریبا 38 مورد رشد کرده است. از 149 مدل پایه ارائه شده در سال 2023، حدود 98 مدل باز و 28 مدل بدون هیچ‌گونه دسترسی عرضه شدند. درواقع در سال 2023، بیشتر مدل‌های پایه یعنی 65.8 درصد با دسترسی آزاد عرضه شدند؛ درحالی‌که 18.8 درصد فاقد دسترسی و 15.4 درصد نیز با دسترسی محدود ارائه شدند. از سال 2021، دنیا شاهد افزایش قابل توجهی در عرضه مدل‌های هوش مصنوعی با دسترسی باز بوده است.

آمریکا رتبه نخست بیشترین مدل‌های پایه در دنیا

در سال 2023، بیشتر مدل‌های پایه از بخش‌های صنعتی منشأ گرفتند که سهم 72.5 درصدی را از آن خود کردند. تنها 18.8 درصد از مدل‌های پایه در سال 2023 سهم دانشگاه بوده‌اند. از سال 2019، تعداد بیشتری از مدل‌های پایه سهم صنعت بوده‌اند. مدل‌های پایه مختلف در سال 2023 از سوی منابع مختلف ارائه شده‌اند. طبق آمار، گوگل با ارائه 18 مدل پایه، بیشترین مدل‌های ارائه شده را به خود اختصاص داده است. پس از آن هم شرکت «متا» با 11 مدل و مایکروسافت با 9 مدل در رده‌های دوم و سوم قرار گرفتند. دانشگاه «برکلی UC» در میان سایر دانشگاه‌ها، بیشترین مدل‌های پایه را در سال 2023 عرضه کرد. با توجه به اینکه مدل‌های پایه تا حدودی بیانگر پژوهش‌های مرزی هوش مصنوعی هستند، از منظر ژئوپلیتیکی، درک وابستگی‌های ملی آنها اهمیت دارد. در سال 2023، بیشتر مدل‌های پایه در دنیا از آن آمریکا با 109 مدل و پس از آن، چین با 20 مدل و سپس انگلیس با 8 مدل است.
هزینه میلیون دلاری آموزش مدل‌های هوش مصنوعی
موضوع مهمی که در مورد مدل‌های پایه هوش مصنوعی مطرح می‌شود، هزینه‌هایی است که پیرامون آموزش آن برآورد می‌شود. درحالی‌که شرکت‌های هوش مصنوعی به‌ندرت هزینه‌های مربوط به آموزش مدل‌های خود را فاش می‌کنند، باور عمومی بر این است که این هزینه‌ها میلیون‌ها دلار است و روزبه‌روز هم در حال افزایش است. به‌عنوان مثال، مدیرعامل OpenAI عنوان کرده که هزینه آموزش مدل GPT-4 بیش از 100 میلیون دلار بوده است. این افزایش هزینه‌های آموزش، دانشگاه‌ها را که معمولا به‌عنوان مراکز سنتی پژوهشی هوش مصنوعی فعالیت می‌کنند، از توسعه مدل‌های پایه و پیشگام محروم کرده است. در واکنش به این موضوع، رئیس‌جمهور آمریکا در راهکاری سیاسی، یک دستور اجرایی در مورد هوش مصنوعی را اعلام کرده که به دنبال آن، درصدد ایجاد یک منبع ملی پژوهشی درباره هوش مصنوعی است که محاسبات و داده‌های مورد نیاز برای انجام پژوهش‌های سطح بالاتر در حوزه هوش مصنوعی را در اختیار فعالان غیرصنعتی قرار می‌دهد. شاخص هوش مصنوعی یکی از نخستین مواردی است که برآوردهایی را در مورد هزینه‌های آموزشی ارائه می‌کند. هزینه آموزشی تخمینی مرتبط با مدل‌های انتخابی هوش مصنوعی براساس قیمت اجاره محاسبات ابری ارزیابی می‌شود. برآوردهای شاخص هوش مصنوعی این تردید را تایید می‌کند که در سال‌های اخیر هزینه‌های آموزش مدل به‌طور قابل توجهی افزایش یافته است. به‌عنوان مثال، در سال 2017، مدل اصلی «ترانسفورمر» که برای پردازش «زبان طبیعی» (NLP) به کار می‌رود، مدل مدرن LLM را پایه‌گذاری می‌کند که حدود 900 دلار هزینه برای آموزش را دربرمی‌گیرد. تا سال 2023، هزینه‌های آموزش GPT-4 شرکت OpenAI و Gemini Ultra شرکت گوگل به ترتیب حدود 78 و 191 میلیون دلار تخمین زده شد.

ارسال نظر