


دانشگاه استنفورد بهتازگی هشتمین گزارش شاخص هوش مصنوعی را منتشر کرد که جامعترین شاخص ارائهشده تاکنون در این حوزه به شمار میرود. با توجه به نفوذ گسترده و روزافزون هوش مصنوعی در جامعه، اقتصاد و حاکمیت جهانی، اهمیت چنین شاخصهایی بیش از پیش خود را نشان میدهد. در گزارش امسال، محققان این دانشگاه تحلیلهای عمیقی از چشمانداز در حال تکامل سختافزار هوش مصنوعی، تخمینهای جدید هزینههای استنتاج و تحلیلهای جدید از روند انتشار و ثبت اختراع هوش مصنوعی ارائه کردهاند.
آنها همچنین دادههای تازهای را در مورد پذیرش شرکتها از شیوههای هوش مصنوعی مسئول، همراه با پوشش گستردهای از نقش رو به رشد هوش مصنوعی در علم و پزشکی معرفی کردهاند. شاخص هوش مصنوعی از زمان تأسیس در سال ۲۰۱۷، بهعنوان شاخهای از مطالعه ۱۰۰ساله هوش مصنوعی ارائه شد که هدف آن، ارائه تازهترین، دقیقترین و معتبرترین دادهها از این فناوری رو به رشد به سیاستگذاران، روزنامهنگاران، مدیران اجرایی، محققان و عموم مردم بوده است.
در واقع، مأموریت آنها همواره کمک به این گروه از افراد بوده تا بتوانند تصمیمات آگاهانهتری را در مورد توسعه و استقرار هوش مصنوعی اتخاذ کنند. شاخص هوش مصنوعی همچنان در ردیابی و تفسیر حیاتیترین روندهای شکلدهنده این حوزه، از تغییر چشمانداز ژئوپلیتیک و تکامل سریع فناوریهای زیربنایی گرفته تا نقش رو به گسترش هوش مصنوعی در تجارت، سیاستگذاری و زندگی عمومی پیشرو است.
در این گستره که هوش مصنوعی با سرعت سرسامآوری پیشرفت میکند، این شاخص میتواند زمینههای ضروری برای تداوم این پیشرفت را فراهم کند. شاخص هوش مصنوعی که در سطح جهان بهعنوان یکی از معتبرترین منابع در زمینه هوش مصنوعی شناخته میشود، در رسانههای بزرگی چون نیویورک تایمز، بلومبرگ و گاردین نیز از آن یاد شده و صدها مقاله دانشگاهی و نیز سیاستگذاران و سازمانهای دولتی نیز در سراسر دنیا از آن یاد کرده و بهرهمند میشوند.
راسل والد، مدیر اجرایی مؤسسه هوش مصنوعی انسانمحور (HAI) دانشگاه استنفورد و عضو کمیته راهبری شاخص هوش مصنوعی معتقد است که هوش مصنوعی یک فناوری تحولآفرین است که هیچ محدودیتی جلودار آن نیست و همچنان پیش میرود و قادر است هر صنعتی را متحول کند. سال گذشته شاهد افزایش سرعت پذیرش هوش مصنوعی با سرعت بیسابقهای بودیم بهطوریکه دامنه و تأثیر آن همچنان رو به رشد خواهد بود. در این گزارش، مانند سالهای گذشته همچنان نامی از ایران نیست، بهجز دو استثنا که مربوط به تعداد دانشجویان مقاطع کارشناسی ارشد و دکتری علوم کامپیوتر در دانشگاههای آمریکا بوده است. در این گزارش، خلاصهای از مهمترین موضوعات مطرح شده در شاخص AI ارائه شده است.
بررسی عملکرد هوش مصنوعی با 3 معیار جدید
محققان در سال ۲۰۲۳ معیارهای جدیدی را مانند GPQA، MMMU و SWE-bench برای آزمایش محدودیتهای سیستمهای هوش مصنوعی پیشرفته معرفی کردند. معیار GPQA یک آزمون طراحیشده برای سنجش توانایی مدلها در پاسخ به سؤالات عمومی است. معیار MMMU نیز مربوط به درک عمومی زبان در موضوعات مختلف است. معیار SWE-bench نیز آزمونی برای رفع مشکلات کد است. تنها یک سال بعد، عملکرد آنها افزایش یافت بهطوریکه امتیاز آنها به ترتیب برای GPQA، MMMU و SWE-bench حدود ۲۰، ۴۹ و ۶۷ درصد رشد پیدا کرد. فراتر از معیارها، سیستمهای هوش مصنوعی گامهای بزرگی در تولید ویدئوهای باکیفیت بالا برداشتند و در برخی تنظیمات، عوامل مدل زبانی حتی در کارهای برنامهنویسی با بودجههای زمانی محدود، عملکرد بهتری نسبت به انسانها از خود نشان دادند.
نفوذ گستردۀ هوش مصنوعی در زندگی روزمره
شاید تا چند سال پیش کسی تصورش را هم نمیکرد که فناوری هوش مصنوعی تا این اندازه بتواند زندگی مردم کره زمین را تسخیر کند. گستره این فناوری تا اندازهای است که از مراقبتهای بهداشتی گرفته تا سیستمهای حمل و نقل را دربرگرفته و به سرعت از فضاهای آزمایشگاهی روانه زندگی روزمره ما شده است. در سال ۲۰۲۳، سازمان غذا و داروی آمریکا (FDA) حدود ۲۲۳ دستگاه پزشکی مجهز به هوش مصنوعی را مورد تأیید قرار داد در حالی که تعداد دستگاههای پزشکی در سال ۲۰۱۵ که مجهز به فناوری هوش مصنوعی بودند، تنها به ۶ دستگاه میرسید که در مقایسه با دستگاههای فعلی ۳ هزار و ۶۱۶ درصد رشد کرده است که بسیار قابل توجه بوده و به عبارتی، نفوذ این فناوری را در دنیای امروز نشان میدهد.
در این میان، خودروهای خودران دیگر نمونههایی آزمایشی تلقی نمیشوند. بهعنوان مثال، شرکت «وایمو» که یکی از بزرگترین اپراتورهای آمریکایی است، هر هفته بیش از ۱۵۰ هزار خودروی سواری خودران را ارائه میدهد در حالی که رباتهای «بایدو» اکنون در سراسر شهرهای چین با قیمت مقرون به صرفهای خدمات تاکسیهای رباتیک Apollo Go را ارائه میدهند.
آمریکا در صدر تولیدکنندگان برتر مدلهای AI
مؤسسات مستقر در آمریکا در سال ۲۰۲۴ حدود ۴۰ مدل هوش مصنوعی قابل توجه تولید کردند که بهطور قابل توجهی نسبت به ۱۵ مدل چینی و ۳ مدل اروپایی پیشی گرفت. در حالی که آمریکا از نظر کمیت مدلها، پیشتازی خود را حفظ کرده، مدلهای چینی به سرعت شکاف کیفیت را پر کردهاند. در این میان، تفاوت عملکرد در معیارهای اصلی مانند MMLU و HumanEval از دو رقمی در سال ۲۰۲۳ به تقریباً همان رقم در سال ۲۰۲۴ کاهش یافت. در عین حال، چین همچنان در مقالات و پتنتهای هوش مصنوعی پیشتاز است. در همین بازه زمانی، توسعه مدلهای هوش مصنوعی بهطور گستردهای جهانی است بهطوریکه مدلهای قابل توجهی در مناطقی چون خاورمیانه، آمریکای لاتین و آسیای جنوب شرقی عرضه شدند.
رشد 30 درصدی مدلهای صنعتی هوش مصنوعی
تقریباً 90 درصد از مدلهای قابلتوجه هوش مصنوعی در سال 2024 از دل صنعت تولید شدهاند درصورتیکه این رقم در سال 2023 حدود 60 درصد بوده است که رشد 30 درصدی را نشان میدهد. این در حالی است که دانشگاه همچنان منبع اصلی پژوهشها به شمار میرود و هنوز هم استناد بالایی را به خود اختصاص میدهد.
مقیاس مدلهای هوش مصنوعی بهسرعت در حال رشد است بهطوری که محاسبات آموزشی هر پنج ماه یکبار، مجموعه دادهها هر 8 ماه یکبار دوبرابر شده و مصرف انرژی سالانه نیز دوبرابر میشود. باوجوداین، شکافهای عملکردی در حال کاهش است بهگونهای که تفاوت امتیاز بین مدلهای برتر و رتبه دهم از حدود 12 درصد به بیش از 5 درصد طی یک سال گذشته کاهش یافته و دو مدل برتر، اکنون تنها حدود یک درصد از هم جدا شدهاند. این آمارها حکایت از آن دارد که رقابت در این حوزه بسیار تنگاتنگ است.
