تصاویر؛ چرا هوش مصنوعی نمیتواند هنر بیافریند؟

آیا هنر ویژگی خاصی دارد که باعث میشود نتوان آن را همانطور که دال در تخیلش به تصویر کشیده است، صرفاً با فشار دادن یک دکمه خلق کرد؟ در حال حاضر، داستانهایی که مدلهای زبانی بزرگی مانند ChatGPT تولید میکنند بسیار ضعیفاند، اما میتوان تصور کرد که این برنامهها در آینده پیشرفت کنند. این پیشرفت تا چه حد میتواند باشد؟
آیا هوش مصنوعی مولد میتواند هنر یا ادبیات تولید کند؟ این سوالی است که این روزها زیاد پرسیده میشود و تد چیانگ، نویسندهی علمیتخیلی که فیلم «ورود» (Arrival) از داستان او اقتباس شده، تلاش کرده پاسخی به این سوال بدهد. در نظر او، برای خلق یک رمان یا نقاشی، هنرمند انتخابهایی انجام میدهد که ذاتاً برای هوش مصنوعی بیگانهاند. به نقل از خودش:
در سال ۱۹۵۳، رولد دال داستان کوتاهی به نام «صرفونحوکن بزرگ خودکار» (The Great Automatic Grammatizator) را منتشر کرد که دربارهی یک مهندس برق بود که در دلش آرزوی نویسنده شدن داشت. روزی، پس از تکمیل ساخت سریعترین ماشین حساب جهان، این مهندس بهطور ناگهانی متوجه شد که «دستور زبان انگلیسی تابع قوانینی است که تقریباً به اندازهی قواعد ریاضی ساختارمحورند.» بنابراین، او دستگاهی برای داستاننویسی میسازد که میتواند یک داستان کوتاه پنجهزار کلمهای را در سی ثانیه تولید کند؛ نوشتن یک رمان برای دستگاه تنها پانزده دقیقه طول میکشد و اپراتور آن، مانند کسی که در حال رانندگی یا نواختن ارگ است، با استفاده از دستهها و پدالها، میزان طنز و احساسات نهفته در داستان را تنظیم میکند. این رمانها چنان محبوب میشوند که در عرض یک سال، نیمی از داستانهای منتشرشده به زبان انگلیسی محصول اختراع این مهندس هستند.
آیا هنر ویژگی خاصی دارد که باعث میشود نتوان آن را همانطور که دال در تخیلش به تصویر کشیده است، صرفاً با فشار دادن یک دکمه خلق کرد؟ در حال حاضر، داستانهایی که مدلهای زبانی بزرگی مانند ChatGPT تولید میکنند بسیار ضعیفاند، اما میتوان تصور کرد که این برنامهها در آینده پیشرفت کنند. این پیشرفت تا چه حد میتواند باشد؟ آیا ممکن است این مدلها همانطور که ماشینحسابها در انجام جمع و تفریق از انسان بهتر هستند، در نوشتن داستان، نقاشی یا فیلمسازی، از انسانها پیشی بگیرند؟ این در حالی است که استفاده از هوش مصنوعی در فیلمها و به طور کلی دنیای هنر به یک معضل اساسی تبدیل شده است.
دشواری تعریف هنر زبانزد خاص و عام است و بین هنر خوب و بد هم بهسختی میتوان تمایز برقرار کرد. اما اجازه دهید یک قاعدهی کلی ارائه دهم: هنر چیزی است که از مجموعهای از انتخابها به وجود آمده است. این موضوع را شاید بتوان با مثال نویسندگی داستان بهتر توضیح داد. هنگام نوشتن داستان، شما – آگاهانه یا ناآگاهانه – در مورد تقریباً هر کلمهای که مینویسید یک انتخاب انجام میدهید؛ بهبیان ساده، میتوان گفت که یک داستان کوتاه دههزارکلمهای مستلزم حدود دههزار انتخاب است. اما وقتی به یک برنامهی هوش مصنوعی مولد (Generative AI) یک فرمان متنی میدهید، تعداد انتخابهای شما بسیار اندک است؛ اگر یک فرمان صدکلمهای بنویسید، در نهایت حدود صد انتخاب انجام دادهاید.
اگر یک هوش مصنوعی بر اساس فرمان شما یک داستان دههزارکلمهای تولید کند، ناگزیر باید برای تمام انتخابهایی که شما انجام ندادهاید جایگزینی در نظر بگیرد. این کار را میتواند به روشهای گوناگونی انجام دهد. یکی از این روشها میانگینگیری از انتخابهایی است که نویسندگان دیگر انجام دادهاند، انتخابهایی که در متونی که در اینترنت پیدا میشوند منعکس شده است؛ این میانگین معادل پیشپاافتادهترین انتخابهای ممکن است و به همین دلیل، متونی که هوش مصنوعی تولید میکند اغلب بهشدت کسالتبار هستند. روش دیگر، دستور دادن به برنامه برای تقلید از سبک یک نویسندهی مشخص است، که در نهایت داستانی کاملاً مشتقشده تولید میکند. در هیچیک از این دو حالت، یک اثر هنری بدیع آفریده نمیشود.
به گمان من، همین اصل بنیادین در مورد هنرهای تجسمی نیز صدق میکند، هرچند شمردن انتخابهایی که یک نقاش انجام میدهد دشوارتر است. نقاشیهای واقعی حاصل تعداد بیشماری تصمیمگیری هستند. در مقابل، فردی که از یک برنامهی تبدیل متن به تصویر، مانند دال-ای (Dall-E) استفاده میکند، صرفاً فرمانی نظیر «یک شوالیه ملبس به زرهی درخشان با اژدهایی آتشافروز میجنگد» وارد میکند و باقی کار را به برنامه میسپارد. (جدیدترین نسخهی دال-ای فرمانهایی تا چهار هزار حرف یا چند صد واژه را میپذیرد، اما حجم فرمان در حدی نیست که بتوانید با آن تمام جزییات صحنه را توصیف کنید). اغلب انتخابهایی که در تصویر نهایی دیده میشود ناگزیر از نقاشیهای مشابهی که در اینترنت وجود دارد وام گرفته شدهاند؛ ممکن است تصویر از لحاظ فنی خیرهکننده باشد، اما فردی که فرمان را وارد کرده نمیتواند ادعای خلق آن را داشته باشد.
برخی صاحبنظران تصور میکنند که مولدهای تصویر بهاندازهی ظهور عکاسی در گذشته، تأثیری عمیق بر فرهنگ بصری خواهند گذاشت. اگرچه این ایده در نگاه نخست موجه به نظر میرسد، اما مقایسهی عکاسی با هوش مصنوعی مولد مستلزم بررسی دقیقتری است. گمان میکنم هنگامی که عکاسی برای نخستین بار ظهور پیدا کرد، کمتر کسی به آن به چشم رسانهای هنری نگاه میکرد، زیرا به نظر نمیرسید که در پروسهی عکاسی تصمیمات زیادی گرفته شود؛ تنها کافی بود دوربین را تنظیم کرده و نوردهی را آغاز کنید. اما با گذشت زمان، مردم دریافتند که با دوربینها میتوان کارهای بسیار متنوعی انجام داد و هنر عکاسی در واقع در همین انتخابهای گوناگون نهفته است. شاید همیشه نتوان بهراحتی ماهیت این انتخابها را توضیح داد، اما وقتی عکسهای یک عکاس آماتور را با آثار یک عکاس حرفهای مقایسه میکنید، تفاوت بهوضوح آشکار است.
حال، پرسش این است که آیا در استفاده از یک هوش مصنوعی مولد متنبهتصویر نیز امکان اتخاذ چنین طیف وسیعی از تصمیمات وجود دارد؟ به نظر من، پاسخ منفی است. یک هنرمند – چه دیجیتالی کار کند و چه با رنگ و بوم – در فرآیند خلق یک نقاشی، بهطور ضمنی تصمیمات بسیار بیشتری میگیرد تا آنچه در قالب فرمانی چندصدکلمهای به یک مولد تصویر قابل گنجاندن است.
میتوان فرض را بر این گرفت که روزی مولد متنبهتصویری تولید خواهد شد که به شما اجازه میدهد در طی نوبتهای متعدد، دهها هزار واژه را داخل کادر فرمان بنویسید تا کنترلی بسیار دقیق و پرجزییات روی تصویری که تولید میشود به دست بیاورید؛ این مولد را میتوان به نسخهای از فوتوشاپ تشبیه کرد که تنها از راه متن کنترل میشود.
میتوان گفت که فردی که از چنین برنامهای استفاده کند، همچنان سزاوار عنوان هنرمند است. کارگردان سینما، بنت میلر (Bennett Miller)، از DALL-E 2 برای خلق تصاویری چشمگیر استفاده کرد که در گالری گاگوسیان (Gagosian Gallery) به نمایش درآمدند؛ او برای تولید این آثار، فرمانهای متنی دقیقی تنظیم کرد و سپس به دال-ای دستور داد تصویرهای تولیدشده را بارها و بارها اصلاح و دستکاری کند. او بیش از صدهزار تصویر تولید کرد و از بین آنها بیست تصویر نهایی را که به نمایشگاه راه پیدا کردند انتخاب کرد.
با این حال، میلر اذعان کرده که در نسخههای جدیدتر دال-ای موفق به دستیابی به نتایجی مشابه نشده است. احتمال میدهم که دلیل این امر آن باشد که میلر از دال-ای برای کاری استفاده میکرد که اساساً برای آن طراحی نشده بود؛ گویی که او نرمافزار سادهای مانند مایکروسافت پینت را هک کرده بود تا رفتاری مشابه فوتوشاپ از خود نشان دهد، اما به محض انتشار نسخهی جدیدی از پینت، ترفندهای هکری او دیگر کارایی گذشته را نداشتند.

سه تا از عکسهایی که بنت میلر برای گالری گوگوسیان با هوش مصنوعی مولد Dall-E 2 تولید کرد. – عکس ۱

عکس ۲

عکس ۳
احتمالاً OpenAI در تلاش نیست محصولی برای کاربرانی مانند میلر بسازد، زیرا محصولی که کاربر برای تولید یک تصویر با آن باید چند ماه وقت بگذارد، برای بیشتر مخاطبان جذابیت نخواهد داشت. این شرکت به دنبال ارائهی محصولی است که تصاویر را با کمترین زحمت تولید کند.
تصور برنامهای که در نوبتهای متعدد به شما در نوشتن یک رمان خوب کمک کند، دشوارتر است. چنین برنامهی فرضی ممکن است از شما بخواهد که یک فرمان ورودی صد هزار کلمهای وارد کنید تا بتواند صد هزار واژهی کاملاً متفاوت تولید کند و رمانی را که در ذهن دارید، پدید آورد. اما چنین برنامهای دقیقاً چگونه عمل خواهد کرد؟ مشخص نیست. از لحاظ نظری، اگر چنین برنامهای وجود داشت، شاید بتوان گفت که کاربر همچنان شایستهی لقب نویسنده بود. اما باز هم به نظر نمیرسد که شرکتهایی مانند OpenAI علاقهای به ساخت نسخههایی از ChatGPT داشته باشند که همانقدر از کاربران زمان و تلاش بطلبد که نوشتن یک رمان از صفر نیاز دارد. نکتهی تبلیغاتی هوش مصنوعی مولد این است که خروجی آنها بسیار گستردهتر و حجیمتر از ورودیای است که شما بهشان میدهید و دقیقاً همین ویژگی است که مانع از تبدیل شدن آنها به ابزاری موثر برای هنرمندان میشود.
شرکتهایی که از برنامههای هوش مصنوعی مولد حمایت میکنند، ادعا دارند که این فناوری خلاقیت را شکوفا خواهد کرد. به بیان ساده، آنها میگویند که هنر میتواند کاملاً حاصل الهامگیری باشد و هیچ زحمتی نداشته باشد، اما این دو عنصر را نمیتوان بهراحتی از هم جدا کرد. حرف من این نیست که هنر باید الزاماً همراه با ملال و رنج باشد. بلکه معتقدم که هنر در هر مقیاسی نیازمند اتخاذ تصمیمات است؛ انتخابهای ریز و بیشماری که در مرحلهی آفرینش هنر انجام میشوند، به اندازهی چند انتخاب کلیدی و کلانی که در مرحلهی ایدهپردازی انجام میشوند، در محصول نهایی تاثیر دارند. در فرآیند آفرینش اثر هنری، این یک اشتباه اساسی است که مقیاس بزرگ را مترادف با اهمیت تلقی کنیم؛ چرا که جوهرهی هنر در تعامل میان تصمیمات در مقیاس بزرگ و مقیاس کوچک نهفته است.
باور به اینکه الهامگیری از هر عامل دیگری مهمتر است، به گمان من، نشانهای از ناآشنایی فرد با آن رسانهی خاص است. چنین مسئلهای حتی در صورتی که هدف، تولید اثری سرگرمکننده باشد و نه یک شاهکار هنری، همچنان صدق میکند. مردم اغلب میزان تلاش مورد نیاز برای خلق یک اثر سرگرمکننده را دستکم میگیرند؛ یک رمان هیجانی شاید به آرمان کافکا از یک کتاب («تبری بر دریای یخزدهی درونمان») نزدیک نشود، اما همچنان ممکن است دقت یک ساعت سوئیسی در نوشته شدن آن به کار رفته باشد. یک رمان مهیج موفق، چیزی فراتر از طرح و ایدهی اولیهی خود است. نمیتوان تمام جملات یک رمان تریلر را با جملاتی که از لحاظ معنایی معادل آنها هستند جایگزین کرد و همچنان انتظار داشت که اثر به همان اندازه سرگرمکننده باشد. این یعنی جملات و انتخابهای ظریفی که در مقیاس کوچک انجام میشوند، نقشی تعیینکننده در اثربخشی نهایی یک اثر دارند.
بسیاری از رماننویسان تجربهی رویارویی با افرادی را داشتهاند که با اطمینان ادعا میکنند ایدهی شگفتانگیزی برای یک رمان دارند و حاضرند آن را در ازای تقسیم پنجاهپنجاه سود فروش آن، با نویسنده به اشتراک بگذارند. چنین افرادی ناخواسته نشان میدهند که گمان میکنند جملهپردازی یک کار اضافی و کسلکننده است، نه بخشی بنیادی از قصهگویی در قالب نثر. هوش مصنوعی مولد برای کسانی جذاب است که تصور میکنند میتوانند در یک رسانهی هنری ابراز وجود کنند، بدون آنکه واقعاً در آن رسانه کار کنند. اما خالقان رمانهای سنتی، نقاشیها و فیلمها، به این هنرها جذب میشوند زیرا در هر یک از این رسانهها امکان بیانی منحصربهفرد را میبینند. آنها به دلیل اشتیاقشان برای بهرهگیری کامل از این امکانات است که از خلق آثار خود، چه در مقام هنر و چه در مقام سرگرمی، احساس رضایت میکنند.
البته، بیشتر نوشتهها – از مقالات گرفته تا گزارشها و ایمیلها – با این پیشفرض که هزاران انتخاب در پس تولیدشان نهفته است، تولید نمیشوند. در چنین مواردی، آیا خودکارسازی نوشتار آنها ضرری دارد؟ اجازه دهید یک قاعدهی کلی دیگر را پیشنهاد کنم: هر نوشتهای که ارزش توجه شما را بهعنوان خواننده داشته باشد، نتیجهی تلاش نویسندهی آن است. البته تلاش کردن لزوماً به معنای ارزشمند بودن محصول نهایی نیست، اما هیچ اثر ارزشمندی بدون تلاش بهوجود نمیآید. نوع توجهی که هنگام خواندن یک ایمیل شخصی صرف میکنید، با نوع توجهی که به خواندن یک گزارش تجاری اختصاص میدهید، متفاوت است، اما در هر دو مورد، تنها زمانی این توجه موجه است که نویسنده برای نوشتن آن فکر و انرژی صرف کرده باشد.
اخیراً، گوگل در جریان المپیک پاریس، تبلیغی برای جمنای (Gemini)، رقیب خود برای GPT-4 شرکت OpenAI پخش کرد. در این تبلیغ، پدری با استفاده از جمنای یک نامهی هواداری از طرف دخترش مینویسد تا دخترش آن را برای ورزشکاری که الهامبخش اوست بفرستد. اما گوگل پس از واکنشهای منفی گسترده از سوی مخاطبان، این تبلیغ را حذف کرد؛ یک استاد رسانه، آن را «یکی از نگرانکنندهترین تبلیغاتی که تاکنون دیدهام» توصیف کرد. نکتهی قابل توجه این است که این واکنشها حتی در شرایطی رخ داد که موضوع مورد بحث، خلاقیت هنری نبود. کسی انتظار ندارد که نامهی هواداری یک کودک به یک ورزشکار، اثری خارقالعاده باشد؛ اگر این دختر خودش نامه را نوشته بود، احتمالاً نوشتهی او تفاوتی با هزاران نامهی مشابه دیگر نداشت. اما اهمیت چنین نامهای – چه برای کودکی که آن را مینویسد و چه برای ورزشکاری که آن را دریافت میکند – در این نیست که نامه چقدر شیوا نوشته شده، بلکه در این است که از دل برآمده است.
بسیاری از ما کارتهای تبریک آماده برای دیگران ارسال کردهایم، در حالی که میدانستیم دریافتکننده متوجه خواهد شد که خودمان کلمات روی آن را ننوشتیم. اما هیچکس جملات روی کارتهای هالمارک (Hallmark) را با دستخط خود بازنویسی نمیکند، زیرا چنین کاری حالتی فریبکارانه دارد. برنامهنویسی به نام سایمون ویلیسون (Simon Willson)، فرآیند آموزش مدلهای زبانی بزرگ را «پولشویی دادههای دارای کپیرایت» توصیف کرده است و این تعبیر، راهی مفید برای درک جذابیت هوش مصنوعی مولد ارائه میدهد: این فناوری به شما امکان میدهد که نوعی سرقت ادبی انجام دهید، اما بدون آنکه احساس گناه کنید، زیرا حتی برای خود شما هم روشن نیست که دقیقاً در حال کپی کردن چه چیزی هستید.
برخی استدلال میکنند که مدلهای زبانی بزرگ، به جای «پولشویی» متون آموزشی، از آنها یاد میگیرند، درست همانطور که نویسندگان انسانی از کتابهایی که خواندهاند، آموختهاند. اما یک مدل زبانی بزرگ، نویسنده نیست؛ حتی کاربر زبان هم نیست. طبق تعریف، زبان یک سامانهی ارتباطی است و برای به کار برده شدن، باید قصد ارتباط با آن را داشته باشید. قابلیت تکمیل خودکار (Autofill) در تلفن شما ممکن است پیشنهادهای خوب یا پیشنهادهای بدی برای پیغام فرستادن به شما بدهد، اما در هیچ موقعیتی تلاش نمیکند از جانب خودش چیزی را به شما یا به فردی که در حال ارسال پیام به او هستید منتقل کند. توانایی چتجیپیتی در تولید جملات منسجم، شاید این تصور را در ذهن ما ایجاد کند که تفاوتی بنیادین با قابلیت تکمیل خودکار اسمارتفونهایمان دارد، اما در واقعیت، این مدل، مثل قابلیت تکمیل خودکار، هیچگونه قصد ارتباطی ندارد.
دستور دادن بهChatGPT برای ایجاد عبارتی مانند «از دیدنت خوشحالم» بسیار ساده است. بسیاری از جنبههای عملکرد مدلهای زبانی بزرگ هنوز برای ما مبهم است، اما یک چیز را با اطمینان میدانیم: چتجیپیتی از دیدن من و شما خوشحال نیست. یک سگ میتواند احساس خوشحالی از دیدن شما را ابراز کند؛ و همینطور کودکی که هنوز زبان نیاموخته است. این دو موجود بدون اینکه شیوهی استفاده از کلمات را بلد باشند، احساسی را به شما منتقل میکنند. اماChatGPT نه احساسی دارد و نه چیزی میخواهد، و دقیقاً همین نداشتن قصد ارتباطی است که باعث میشود آن را کاربر زبان ندانیم. آنچه عبارت «از دیدنت خوشحالم» را به یک جملهی زبانی تبدیل میکند، صرفاً ساختار صحیح آن نیست، بلکه قصد و نیت برقراری ارتباط است که در پس این جمله نهفته است.
از آنجا که زبان برای ما امری بدیهی و طبیعی به نظر میرسد، اغلب فراموش میکنیم که این توانایی، بر پایهی تجربههای بنیادینتری مانند احساسات درونی و میل به برقراری ارتباط شکل گرفته است. هنگامی که یک مدل زبانی بزرگ جملاتی منسجم تولید میکند، وسوسه میشویم ویژگیهای انسانی را به آن نسبت دهیم، اما در واقع، این فقط شبیهسازی است. این پدیده همانند مکانیزمی است که باعث میشود برخی پروانهها لکههای تیرهی بزرگی روی بالهای خود داشته باشند، لکههایی که پرندگان را فریب میدهند تا آنها را با شکارچیانی با چشمان بزرگ اشتباه بگیرند. در این شرایط، همین شبیهسازی کافی است؛ پرندگان کمتر به این پروانهها حمله میکنند، و برای پروانه اهمیتی ندارد که چرا زنده مانده است؛ تنها چیزی که مهم است، ادامهی حیات اوست. اما تفاوتی عمیق میان یک پروانه و یک شکارچی واقعی که تهدیدی برای پرنده محسوب میشود، وجود دارد.
فردی که از هوش مصنوعی مولد برای کمک گرفتن در نوشتن استفاده میکند، ممکن است ادعا کند که صرفاً از متونی که مدل بر اساس آنها آموزش دیده، الهام میگیرد. اما این ادعا تفاوتی اساسی با فرآیند الهام گرفتن یک نویسنده از نویسندهی دیگر دارد. تصور کنید که یک دانشجو، مقالهای تحویل دهد که صرفاً شامل یک نقلقول پنجصفحهای از یک کتاب است و استدلال کند که این نقلقول، دقیقاً همان چیزی را بیان میکند که او میخواست بگوید، آن هم به شکلی بهتر از آنچه خودش میتوانست بنویسد. حتی اگر این دانشجو کاملاً روراست باشد و به استادش توضیح دهد که چه کرده است، نمیتوان گفت که او واقعاً از این کتاب الهام گرفته است. اینکه یک مدل زبانی بزرگ بتواند آن نقلقول را تا حدی بازنویسی کند که منبع اصلی آن غیرقابل شناسایی شود، تغییری در ماهیت آنچه رخ داده، ایجاد نمیکند.
همانطور که زبانشناسی به نام امیلی ام. بندر (Emily M. Bender) اشاره کرده است، دلیل اینکه معلمان از دانشآموزانشان میخواهند مقاله بنویسند این نیست که جهان به مقالههای بیشتری نیاز دارد. هدف از نوشتن مقاله، تقویت مهارتهای تفکر انتقادی فرد است؛ همانطور که دمبل زدن برای انجام هر ورزشی مفید است، نوشتن مقاله نیز مهارتهایی را تقویت میکند که در هر شغلی که یک دانشجو در آینده به دست آورد، ضروری خواهند بود. استفاده از ChatGPT برای انجام تکالیف، مانند آوردن یک لیفتراک به داخل سالن وزنهبرداری است؛ با این کار، توانایی ذهنی شما هرگز تقویت نخواهد شد.
البته لازم نیست همهی نوشتهها خلاقانه، صمیمانه یا حتی باکیفیت باشند؛ گاهی اوقات، تنها کافی است که وجود داشته باشند. این نوع از نوشتهها میتوانند اهداف دیگری را دنبال کنند، مانند جذب مخاطب برای تبلیغات یا برآورده کردن الزامات اداری. در چنین شرایطی، نمیتوانیم آدمها را سرزنش کنیم که چرا از ابزارهای در دسترس، برای سرعت بخشیدن به کار خود استفاده میکنند. اما آیا دنیایی که پر از متونی باشد که با حداقل تلاش تولید شدهاند، جای بهتری خواهد بود؟
این ادعا که پرهیز از استفاده از مدلهای زبانی بزرگ نیاز به تولید متون دمدستی را از بین خواهد برد غیرواقعبینانه است. اما آنچه اجتنابناپذیر به نظر میرسد، این است که هرچه بیشتر از این مدلها برای برآورده کردن این نیازها استفاده کنیم، این نیازها نیز بیشتر خواهند شد. ما در حال ورود به دورهای هستیم که در آن ممکن است فردی از یک مدل زبانی برای تبدیل یک لیست گلولهای به یک متن کامل و یکپارچه استفاده کند و سپس شخص دیگری همان متن را با یک مدل زبانی دیگر دوباره به لیستی از نکات کلیدی تبدیل کند. آیا کسی واقعاً میتواند ادعا کند که این پیشرفت محسوب میشود؟
این احتمال وجود دارد که روزی برنامههای کامپیوتری بتوانند هر کاری را که یک انسان انجام میدهد انجام دهند، اما برخلاف ادعاهای شرکتهای تبلیغکنندهی هوش مصنوعی، چنین چیزی در چند سال آینده اتفاق نخواهد افتاد. حتی در حوزههایی که هیچ ارتباطی با خلاقیت ندارند، مدلهای هوش مصنوعی کنونی محدودیتهای عمیقی دارند که باعث میشود با تردید به این سؤال نگاه کنیم که آیا واقعاً شایستهی صفت «هوشمند» هستند یا نه؟
فرانسوا شوله (François Chollet) دانشمند علوم کامپیوتر، تمایز جالبی را مطرح کرده است: مهارت به کیفیت اجرای یک وظیفه مربوط میشود، در حالیکه هوش یعنی توانایی یادگیری مهارتهای جدید بهطور کارآمد. این تعریف با درک شهودی ما از هوش انسانی سازگار است؛ بیشتر افراد میتوانند با تمرین کافی، یک مهارت جدید را بیاموزند، اما هرچه سرعت یادگیری فرد بیشتر باشد، او را باهوشتر تلقی میکنیم.
نکتهی جالب دربارهی این تعریف این است که برخلاف آزمونهای ضریب هوشی (IQ)، نهتنها برای انسانها، بلکه برای موجودات غیرانسانی نیز قابلاستفاده است. مثلاً اگر یک سگ خیلی سریع ترفندی جدید را یاد بگیرد، این را نشانهای از هوش او در نظر میگیریم.
در سال ۲۰۱۹، پژوهشگران آزمایشی انجام دادند که در آن سعی داشتند به موشها رانندگی بیاموزند. آنها موشها را در جعبههای پلاستیکی کوچکی قرار دادند که سه نوار سیمی مسی داشتند. وقتی موشها با پنجههایشان یکی از این نوارها را لمس میکردند، جعبه یا به سمت جلو حرکت میکرد یا به چپ و راست میچرخید. موشها که بشقابی از غذا را در طرف دیگر اتاق میدیدند، سعی میکردند وسیلهی نقلیهی خود را به سمت آن هدایت کنند. پژوهشگران این موشها را در جلسات پنجدقیقهای آموزش دادند و بعد از بیستوچهار جلسهی تمرینی، آنها به رانندگان ماهری تبدیل شدند.
بیستوچهار جلسه تمرین، برای آموزش موفقیتآمیز مهارتی که در کل تاریخ تکاملی موشها وجود نداشته است کفایت کرد. آیا این تعریفی از هوش نیست؟
حالا برنامههای هوش مصنوعی کنونی را در نظر بگیرید؛ همانهایی که بهخاطر عملکردشان بهشدت تحسین شدهاند. آلفازیرو (AlphaZero)، برنامهای که دیپمایند (Deepmind)، یکی از زیرمجموعههای گوگل آن را توسعه داده، بهتر از هر انسانی شطرنج بازی میکند، اما در طول دورهی آموزش خود چهلوچهار میلیون بازی انجام داده است، رقمی که هیچ انسانی در طول عمرش به آن نخواهد رسید. اگر این هوشمصنوعی بخواهد در یک بازی جدید استاد شود، باید بهتناسب وقت برای آموزش دیدنش گذاشت.
بر اساس تعریف شوله، برنامههایی مثل آلفازیرو دارای مهارت بالایی هستند، اما هوش چندانی ندارند، زیرا در یادگیری مهارتهای جدید چندان کارآمد نیستند. در حال حاضر، نوشتن برنامهای که بتواند حتی یک وظیفهی ساده را در تنها طی ۲۴ تلاش بیاموزد – بدون اینکه اطلاعاتی از قبل در اختیارش گذاشته شود – غیرممکن است.
نمونهی دیگر: خودروهای خودران. این خودروها با وجود اینکه میلیونها کیلومتر رانندگی را در دادههای آموزشی خود دارند، همچنان ممکن است با تریلیای که واژگون شده است برخورد کنند، چون این وضعیت در دادههای آموزشیشان رایج نیست. در مقابل، یک انسان در نخستین جلسهی آموزش رانندگی هم خواهد دانست که با دیدن چنین صحنهای باید توقف کند.
آنچه میزان هوشمندی ما انسانها را تعیین میکند، نه توانایی ما در حل مسائل جبر، بلکه توانایی ما در وفق دادن خودمان با شرایط ناآشناست. کامپیوترها تا زمانی که چنین قابلیتی را به دست نیاورند، قادر نخواهند بود جایگزین انسانها شوند و این مسیر هنوز بسیار طولانی است. در حال حاضر، ما تنها بهدنبال یافتن مشاغلی هستیم که بتوان آنها را با قابلیت تکمیل خودکار تسریعشده انجام داد.
باوجود تمام هیاهوها، تاثیر هوش مصنوعی مولد بر افزایش چشمگیر بهرهوری اقتصادی همچنان در حد نظریه باقی مانده است. اوایل امسال، گلدمن ساکس گزارشی با عنوان «هوش مصنوعی مولد: هزینهی بیش از حد، سود بسیار اندک؟» منتشر کرد.
بزرگترین موفقیت این فناوری نه در بهبود تولید محتوا، بلکه در کاهش انتظارات ما نهفته است؛ هم پیرامون آنچه میخوانیم و هم پیرامون آنچه هنگام نوشتن برای دیگران تولید میکنیم. این فناوری اساساً هویتی ضدانسانی دارد، زیرا ما را کمتر از آنچه که هستیم – آفرینندگان و درککنندگان معنا – میپندارد. هوش مصنوعی، میزان «قصد و نیت» را در جهان کاهش میدهد.
برخی افراد با این استدلال که بیشتر آنچه انسانها میگویند یا مینویسند، چندان اصیل نیست، از مدلهای زبانی بزرگ دفاع کردهاند. این ادعا درست است، اما بیربط. وقتی کسی به شما میگوید «عذر میخواهم»، مهم نیست که پیش از این، افراد بیشماری این جمله را بر زبان آوردهاند؛ مهم نیست که «عذر میخواهم» از نظر آماری یک رشتهی متداول از کلمات باشد. اگر این عذرخواهی صادقانه باشد، ارزشمند و معنادار است، حتی اگر عذرخواهی، پیش از این دفعات بیشماری بیان شده باشد. به همین ترتیب، اگر به دوستی بگویید «خوشحالم که تو را میبینم»، حرفی پرمعنا زدهاید، حتی اگر این جمله فاقد تازگی باشد.
همین منطق در مورد هنر نیز صدق میکند. فرقی ندارد که در حال نوشتن رمان، خلق نقاشی یا ساختن یک فیلم باشید؛ شما در حال برقراری ارتباط با مخاطب خود هستید. لازم نیست اثر شما از هرآنچه در تاریخ هنر خلق شده، کاملاً متمایز باشد تا ارزشمند باشد؛ آنچه به آن معنا میبخشد، این است که شما آن را گفتهاید. این اثر، برخاسته از تجربهی منحصربفرد شما از زندگی است و در لحظهای خاص از زندگی مخاطب شما به او میرسد؛ همین نکته، آن را جدید و معنادار میسازد. همهی ما محصول آنچه پیش از خودمان وجود داشته هستیم، اما این زیستن ما در تعامل با دیگران است که به جهان معنا میبخشد. این کاری است که یک الگوریتم تکمیل خودکار هرگز قادر به انجام آن نیست؛ نگذارید کسی خلاف این را به شما بگوید.
منبع: خبرآنلاین