ندا اظهری، مترجم: در هفتمین گزارش شاخص هوش مصنوعی 2024 که از سوی موسسه «هوش مصنوعی انسانمحور» دانشگاه استنفورد منتشر شده، شاخص 2024 جامعترین شاخص منتشرشده تا امروز است و در آن، تاثیر هوش مصنوعی بر جامعه به طور مبسوط اشاره شده است. امسال، محققان این موسسه در گزارشی که ارائه کردهاند دامنه مطالعات خود را گسترش دادهاند تا روندهای اساسی مانند پیشرفتهای فنی در هوش مصنوعی، درک عمومی از فناوری و پویایی ژئوپلیتیکی پیرامون توسعه آن را پوشش دهند. این نسخه از گزارش با ارائه دادههای اصلیتر نسبت به سایر گزارشها، برآوردهای جدیدی را در مورد هزینههای آموزش هوش مصنوعی، تجزیه و تحلیل دقیق چشمانداز هوش مصنوعی مسئول، و فضای کاملا جدیدی را، معرفی میکند که به تاثیر هوش مصنوعی بر علم و پزشکی اختصاص دارد. این گزارش، دادههای مرتبط با هوش مصنوعی را ردیابی، گردآوری، خلاصه و تجسم میکند. ماموریت محققان از پیشبرد این گزارش، ارائه دادههای بیطرفانه و بررسی دقیق براساس منابع گسترده است تا سیاستگذاران، محققان، مدیران اجرایی، روزنامهنگاران و عموم مردم بتوانند درک دقیقتری از حوزه پیچیده هوش مصنوعی ایجاد کنند. شاخص هوش مصنوعی در سطح جهانی به عنوان یکی از معتبرترین منابع برای دادهها و بینش درمورد هوش مصنوعی شناخته شده است. نسخههای پیشین که در روزنامههای بزرگ از جمله نیویورکتایمز، بلومبرگ و گاردین ذکر شدهاند، صدها نقل قول دانشگاهی را جمعآوری کرده و توسط سیاستگذاران سطح بالا در آمریکا، انگلیس و اتحادیه اروپا ارجاع داده شده است. نسخه امسال از نظر ابعاد، مقیاس و دامنه از تمام نسخههای قبلی پیشی گرفته است که نشاندهنده رشد روزافزون و حائز اهمیتی است که هوش مصنوعی در زندگی همه ما دارد. بخش نخست گزارش شاخص هوش مصنوعی 2024 به بررسی تحقیق و توسعه در هوش مصنوعی میپردازد که با ارزیابی مقالات و پتنتها در حوزه هوش مصنوعی آغاز و به بررسی سیستمهای شاخص هوش مصنوعی و مدلهای پایه در این حوزه میرسد.
رشد 3برابری مقالات هوش مصنوعی در بازه 12ساله
طبق آماری که تعداد مقالات انگلیسی و چینی زبان را بین سالهای 2010 تا 2022 نشان میدهد، تعداد کل مقالات در حوزه هوش مصنوعی حدودا سه برابر شده به طوری که تعداد آن از حدود 88 هزار مقاله در سال 2010 به بیش از 240 هزار مقاله در سال 2022 رسید. این افزایش در سال گذشته در حدود 1.1 درصد بوده است. در سال 2022، حدود 230 هزار مقاله ژورنالی در مقایسه با 42 هزار مقاله ارسال کنفرانسی به ثبت رسید. از سال 2015، مقالات ژورنالی و کنفرانسی پیرامون هوش مصنوعی با نرخهای قابل مقایسه افزایش یافته است. در سال 2022، تعداد مقالات کنفرانسی حدود 2.6 برابر سال 2015 و تعداد مقالات ژورنالی 2.4 برابر همان سال بوده است. علاوه براین، بررسیهایی که روی مقالات هوش مصنوعی براساس رشته تحصیلی از سال 2010 انجام شده، نشان میدهد که مقالات در حوزه یادگیری ماشینی بیشترین رشد را طی یک دهه گذشته داشته به طوری که از سال 2015 تاکنون با رشد 7 برابری روبهرو بوده است. به دنبال آن، بیشترین مقالات منتشرشده پیرامون هوش مصنوعی را مقالات در حوزه دید کامپیوتری با 21309 مقاله به خود اختصاص داده است. پس از آن هم، رشتههای تشخیص الگو با 19841 مقاله و مدیریت فرآیند با 12052 مقاله در ردههای بعدی قرار گرفتهاند. بررسی دیگری که در این گزارش به آن پرداخته شده، توزیع مقالات هوش مصنوعی براساس گروه یا بخشی است که مقالات به واسطه آنها منتشر میشود و به چند بخش آموزشی، دولتی، صنعتی، غیرانتفاعی و... تقسیم میشوند. این مطالعه به بررسی مقالات این بخشها در آمریکا، چین، انگلیس و اتحادیه اروپا اشاره کرده است. طبق این آمار، در سال 2022، بخش دانشگاهی بیشتر مقالات هوش مصنوعی (حدود 81.1 درصد) را به خود اختصاص داد و موقعیت خود را به عنوان منبع جهانی پیشرو در تحقیقات هوش مصنوعی در یک دهه گذشته در تمام مناطق حفظ کرد. مشارکت بخش صنعتی با سهم حدود 8 درصدی، در آمریکا و پس از آن در اتحادیه اروپا به علاوه انگلیس و چین بیشترین اهمیت را دارد.
مرزهای پژوهشی هوش مصنوعی
در بخش دیگری از گزارش شاخص هوش مصنوعی 2024، به بررسی مرزهای پژوهشی هوش مصنوعی پرداخته شده است. در حالی که بسیاری از مدلهای جدید هوش مصنوعی سالانه معرفی میشوند، تنها یک نمونه کوچک نشاندهنده پیشرفتهترین پژوهشهاست. به طور قطع، آنچه پژوهشهای پیشرفته یا مرزی را تشکیل میدهد تا حد زیادی ذهنی است. شاخص هوش مصنوعی، فرآیندها را در دو نوع هوش مصنوعی مرزی مطالعه میکند؛ یکی «مدلهای شاخص» و دیگری «مدلهای پایه». Epoch که ارائهدهنده دادههای شاخص هوش مصنوع است، از اصطلاح «مدلهای یادگیری ماشینی شاخص» استفاده میکند تا مدلهای شاخصی را مشخص کند که به ویژه در اکوسیستم یادگیری ماشینی/هوشمصنوعی تاثیرگذار است. به عنوان نمونههایی از مدلهای پایه، میتوان به GPT-4، Claude 3 و Gemini اشاره کرد.
صنعت در ارائه مدلهای یادگیری ماشینی از دانشگاه پیش افتاد
هوش مصنوعی Epoch گروهی از محققان را دربرمیگیرد که خود را وقف مطالعه و پیشبینی تحول هوش مصنوعی پیشرفته کردهاند و دادههایی را از هوش مصنوعی و مدلهای یادگیری ماشینی از دهه 1950 ارائه دادهاند. تجزیهوتحلیل این مدلها، یک نمای کلی جامع از تحول چشمانداز یادگیری ماشینی، هم در سالهای اخیر و هم در چند دهه گذشته ارائه میکند. تا سال 2014، دانشگاهها در عرضه مدلهای یادگیری ماشینی پیشرو بودند. از آن زمان به بعد، صنعت در این حوزه پیش افتاد و از دانشگاهها جلو افتاد. در سال 2023، حدود 51 مدل یادگیری ماشینی توسط صنعت تولید شد که در مقایسه با 15 مدل، رشد قابل توجهی را نسبت به دانشگاه نشان میدهد. ظهور 21 مدل شاخص به دنبال همکاری صنعت و دانشگاه در سال 2023 یک رکورد جدید را به ثبت رساند. ایجاد مدلهای پیشرفته هوش مصنوع در حال حاضر به مقدار قابل توجهی داده، قدرت محاسباتی و منابع مالی نیاز دارد که در دانشگاهها در دسترس نیستند. این تغییر به سمت افزایش تسلط بخش صنعتی در مدلهای پیشرو هوش مصنوعی نخستین بار در گزارش شاخص هوش مصنوعی در سال گذشته برجسته شد. اگرچه امسال این شکاف اندکی کاهش یافته اما این روند تا حد زیادی ادامه دارد.
آمریکا نخستین تولیدکننده مدلهای یادگیری ماشینی در دنیا
در سال 2023، آمریکا با 61 مدل شاخص یادگیری ماشینی رتبه نخست دنیا را از آن خود کرد. پس از آن هم چین با 15 مدل و فرانسه با 8 مدل ردههای دوم و سوم را کسب کردند. از سال 2019، اتحادیه اروپا و انگلیس با یکدیگر، در تعداد مدلهای شاخص هوش مصنوعی تولید شده از چین پیشی گرفتند. از سال 2003، آمریکا در مقایسه با سایر کشورهای مهم از قبیل انگلیس، چین و کانادا مدلهای بیشتری تولید کرده است.
پتنتهای هوش مصنوعی در یک سال 62.7 درصد رشد کردند
در بررسی رشد جهانی اختراعات و پتنتهای گرنتشده در حوزه هوش مصنوعی از سال 2010 تا 2022، در یک دهه گذشته، افزایش قابلتوجهی در تعداد پتنتهای هوش مصنوعی و ثبت اختراعها مشاهده شده است. به عنوان مثال، بین سالهای 2010 تا 2014، رشد کل اختراعات و پتنتهای گرنتشده در حوزه هوش مصنوعی 56.1 درصد بوده است. باوجوداین، تنها از سال 2021 تا 2022، تعداد کل پتنتهای هوش مصنوعی 62.7 درصد افزایش یافته است. در تفکیک پتنتها به دو بخش گرنتشده و گرنتنشده، در سال 2022، تعداد پتنتهای گرنتنشده در زمینه هوش مصنوعی به 128 هزار و 952 مورد رسید که بیش از دو برابر میزان پتنتهای گرنتشده بوده است. با گذشت زمان، چشمانداز تاییدیههای پتنتهای هوش مصنوعی به طور قابل توجهی تغییر کرده است. تا سال 2015، نسبت بیشتری از پتنتها در حوزه هوش مصنوعی ثبت شده بود. باوجوداین، بیشتر پروندههای ثبت اختراع هوش مصنوعی گرنتی دریافت نکردهاند که این شکاف به طور قابل توجهی افزایش یافته است. به عنوان مثال، در سال 2015، قریب به 42.2 درصد از کل پتنتهای ثبتشده در حوزه هوش مصنوعی گرنتی دریافت نکردهاند که تا سال 2022، این رقم به 67.4 درصد رسید. شکاف پتنتهای هوش مصنوعی گرنتشده و گرنتنشده در تمام نقاط جغرافیایی شامل چین، اتحادیه اروپا، انگلیس و اروپا مشهود است. در سالهای اخیر، هر سه نقطه جغرافیایی هم در تعداد کل پتنتهای هوش مصنوعی و هم در تعداد پتنتهای اعطاشده افزایش یافته است. در بررسی تفکیک منطقهای اختراعات گرنتشده هوش مصنوعی، از سال 2022، بخش عمدهای از پتنتهای گرنتشده که 75.2 درصد را شامل میشد، از شرق آسیا و اقیانوس آرام سرچشمه میگیرد و آمریکای شمالی با 21.2 درصد، بزرگترین مشارکتکننده بعدی محسوب میشود. تا سال 2011، آمریکای شمالی در تعداد پتنتهای جهانی هوش مصنوعی پیشتاز بوده است. با وجوداین، از آن زمان تاکنون، تغییر قابلتوجهی به سمت افزایش تعداد پتنتهای هوش مصنوعی از شرق آسیا و اقیانوس آرام صورت گرفته است. به لحاظ تفکیک کشورها، بیشتر پتنتهای گرنتشده هوش مصنوعی در دنیا را چین با سهم 61.1 درصدی از آن خود کرده است و پس از آن نیز آمریکا با سهم 20.9 درصدی در رده دوم قرار گرفته است که در مقایسه با سهم 54.1 درصدی آمریکا در سال 2010، روند کاهشی را نشان میدهد.
65.8 درصد مدلهای پایه هوش مصنوعی دسترسی آزاد دارند
مدلهای پایه، دستهبندی سریع و محبوبی از مدلهای هوش مصنوعی را نشان میدهند. این قبیل مدلها که روی مجموعه دادههای گسترده آموزش دیدهاند، همهکاره بوده و برای کاربردهای پاییندستی مناسب هستند. مدلهای پایه مانند GPT-4، Claude3 و Llama2 تواناییهای قابل توجهی را به نمایش میگذارند و بهطور فزایندهای در سناریوهای دنیای واقعی به کار گرفته میشوند. نمودارهای اکوسیستم که در سال 2023 معرفی شد، یک ابتکار اجتماعی جدید از دانشگاه استنفورد است که اکوسیستم مدل پایه، ازجمله مجموعه دادهها، مدلها و برنامهها را ردیابی میکند. این بخش از دادههای نمودارهای اکوسیستم برای مطالعه روند مدلهای پایه در طول زمان مورد استفاده قرار میگیرند. بهطور کلی مدلهای پایه به روشهای مختلفی قابلیت دسترسی دارند. هیچ مدل دسترسی مانند PaLM-E گوگل فقط برای توسعهدهندگان آن قابل دسترسی نیست. مدلهای دیگر هم مدلهای دسترسی محدود مانند GPT-4 شرکت OpenAI؛ و دسترسی محدودی به مدلها هستند که اغلب از طریق یک API (واسط برنامهنویسی کاربردی) عمومی ارائه میدهند. مدلهای باز مانند Llama2 شرکت «متا» نیز وزنهای مدل را کاملا آزاد میکنند به این معنی که مدلها را میتوان تغییر داد و آزادانه استفاده کرد. در سالهای اخیر، تعداد مدلهای پایه بهشدت افزایش یافته است بهطوریکه این تعداد، از سال 2022 بیش از دو برابر شده و از سال 2019 تقریبا 38 مورد رشد کرده است. از 149 مدل پایه ارائه شده در سال 2023، حدود 98 مدل باز و 28 مدل بدون هیچگونه دسترسی عرضه شدند. درواقع در سال 2023، بیشتر مدلهای پایه یعنی 65.8 درصد با دسترسی آزاد عرضه شدند؛ درحالیکه 18.8 درصد فاقد دسترسی و 15.4 درصد نیز با دسترسی محدود ارائه شدند. از سال 2021، دنیا شاهد افزایش قابل توجهی در عرضه مدلهای هوش مصنوعی با دسترسی باز بوده است.
آمریکا رتبه نخست بیشترین مدلهای پایه در دنیا
در سال 2023، بیشتر مدلهای پایه از بخشهای صنعتی منشأ گرفتند که سهم 72.5 درصدی را از آن خود کردند. تنها 18.8 درصد از مدلهای پایه در سال 2023 سهم دانشگاه بودهاند. از سال 2019، تعداد بیشتری از مدلهای پایه سهم صنعت بودهاند. مدلهای پایه مختلف در سال 2023 از سوی منابع مختلف ارائه شدهاند. طبق آمار، گوگل با ارائه 18 مدل پایه، بیشترین مدلهای ارائه شده را به خود اختصاص داده است. پس از آن هم شرکت «متا» با 11 مدل و مایکروسافت با 9 مدل در ردههای دوم و سوم قرار گرفتند. دانشگاه «برکلی UC» در میان سایر دانشگاهها، بیشترین مدلهای پایه را در سال 2023 عرضه کرد. با توجه به اینکه مدلهای پایه تا حدودی بیانگر پژوهشهای مرزی هوش مصنوعی هستند، از منظر ژئوپلیتیکی، درک وابستگیهای ملی آنها اهمیت دارد. در سال 2023، بیشتر مدلهای پایه در دنیا از آن آمریکا با 109 مدل و پس از آن، چین با 20 مدل و سپس انگلیس با 8 مدل است.
هزینه میلیون دلاری آموزش مدلهای هوش مصنوعی
موضوع مهمی که در مورد مدلهای پایه هوش مصنوعی مطرح میشود، هزینههایی است که پیرامون آموزش آن برآورد میشود. درحالیکه شرکتهای هوش مصنوعی بهندرت هزینههای مربوط به آموزش مدلهای خود را فاش میکنند، باور عمومی بر این است که این هزینهها میلیونها دلار است و روزبهروز هم در حال افزایش است. بهعنوان مثال، مدیرعامل OpenAI عنوان کرده که هزینه آموزش مدل GPT-4 بیش از 100 میلیون دلار بوده است. این افزایش هزینههای آموزش، دانشگاهها را که معمولا بهعنوان مراکز سنتی پژوهشی هوش مصنوعی فعالیت میکنند، از توسعه مدلهای پایه و پیشگام محروم کرده است. در واکنش به این موضوع، رئیسجمهور آمریکا در راهکاری سیاسی، یک دستور اجرایی در مورد هوش مصنوعی را اعلام کرده که به دنبال آن، درصدد ایجاد یک منبع ملی پژوهشی درباره هوش مصنوعی است که محاسبات و دادههای مورد نیاز برای انجام پژوهشهای سطح بالاتر در حوزه هوش مصنوعی را در اختیار فعالان غیرصنعتی قرار میدهد. شاخص هوش مصنوعی یکی از نخستین مواردی است که برآوردهایی را در مورد هزینههای آموزشی ارائه میکند. هزینه آموزشی تخمینی مرتبط با مدلهای انتخابی هوش مصنوعی براساس قیمت اجاره محاسبات ابری ارزیابی میشود. برآوردهای شاخص هوش مصنوعی این تردید را تایید میکند که در سالهای اخیر هزینههای آموزش مدل بهطور قابل توجهی افزایش یافته است. بهعنوان مثال، در سال 2017، مدل اصلی «ترانسفورمر» که برای پردازش «زبان طبیعی» (NLP) به کار میرود، مدل مدرن LLM را پایهگذاری میکند که حدود 900 دلار هزینه برای آموزش را دربرمیگیرد. تا سال 2023، هزینههای آموزش GPT-4 شرکت OpenAI و Gemini Ultra شرکت گوگل به ترتیب حدود 78 و 191 میلیون دلار تخمین زده شد.