ریاضیات هوش مصنوعی
پنجشنبه 01 مهر 1400
ریاضیات هوش مصنوعی

هوش مصنوعی و ریاضیات
اگر شما فردی هستید که به حوزه هوش مصنوعی علاقه دارید و قصد دارید در آینده در یکی از مشاغل این حوزه فعالیت کنید، باید بدانید که پایه و اساس این شاخه از علوم کامپیوتر بر پایه ریاضیات بنا شده است. هوش مصنوعی شامل الگوریتم ها و روش هایی است که ماشین را قادر می سازد به طور خودکار فعالیتی را انجام دهد. تمامی این الگوریتم ها و روش ها با استفاده از مفاهیم ریاضی و آمار و احتمالات تعریف می شوند. به عبارتی، می توان گفت الگوریتم چیزی غیر از چندین مرحله ریاضیاتی نیست. تمام تصمیم گیری های مدل هوشمند در سیستم هایی نظیر سیستم خبره، تمامی الگوریتم های یادگیری نظارت شده و یادگیری نظارت نشده برای دسته بندی داده ها با شبکه عصبی یا خوشه بندی داده ها بر اساس شناسایی آماری الگوی داده ها، کاهش ابعاد داده ها، استخراج ویژگی از داده ها و سایر روش های هوش مصنوعی، بر پایه ریاضیات انجام می شوند.
موضوعات مهم ریاضی هوش مصنوعی- جبر خطی
- حساب دیفرانسیل و انتگرال
- احتمالات
- آمار
- ریاضیات گسسته
- نظریه اطلاعات
بخش مهم و وسیعی از ریاضیات هوش مصنوعی به جبر خطی اختصاص دارد. جبر خطی شاخه ای از ریاضیات است که به رابطه داده ها در فضاهای چند بعدی می پردازد. به عبارتی در این مبحث با روابط خطی داده ها سر و کار داریم و مفاهیمی نظیر ماتریس و بردار، مباحث پایه ای در جبر خطی محسوب می شوند.
مهم ترین مباحث جبر خطی
- عدد اسکالر
- بردار
- ماتریس
- تنسور
- بردار ویژه و مقدار ویژه
- تجزیه مقادیر منفرد
- تحلیل مولفه اساسی
اسکالر: یک عدد واحد می تواند حقیقی یا طبیعی باشد. بردار: فهرستی از اعداد که به ترتیب مرتب شده اند و می توانید آنها را به عنوان نقاطی در فضا در نظر بگیرید که هر عنصر نشان دهنده مختصات در امتداد یک محور است. ماتریس: به آرایشی مستطیلی شکل از اعداد یا عبارات ریاضی که به صورت سطر و ستون شکل یافته ماتریس گفته می شود. تنسور: یک آرایه ND از اعداد است که بر روی یک شبکه منظم با N محور مرتب شده است.
از جبر خطی در توابع زیان (Loss Function) روش های تنظیم (Regularization) الگوریتم های یادگیری ماشین نظیر ماشین بردار پشتیبان (Support Vector Machine) رگرسیون خطی (Linear Regression) روش های بهینه سازی در یادگیری ماشین (Optimization) تغییر ابعاد داده ها، کاهش ابعاد داده ها و میزان نویز آنها استفاده می شود. همچنین از آنجا که داده های مورد نیاز الگوریتم های یادگیری عمیق و شبکه عصبی (Neural Network) در قالب ماتریس و بردار آماده می شوند، جبر خطی به عنوان اصلی ترین ریاضیات در مرحله پیش پردازش داده ها در داده کاوی به حساب می آید.
حساب دیفرانسیل و انتگرالحساب دیفرانسیل و انتگرال با تغییرات در پارامترها، توابع، خطاها و تقریب ها سروکار دارد. دانش کار حسابان چند بعدی در هوش مصنوعی ضروری است. پیش پردازش داده ها و بهینه سازی مدل بر پایه این دو مبحث ریاضی هوش مصنوعی شکل گرفته اند. حساب دیفرانسیل به عنوان ریاضیات مورد نیاز هوش مصنوعی به نحوه تقطیع یک تابع به چندین بخش می پردازد تا بتوان هر جزء از آن را درک و تحلیل کرد. با استفاده از مباحث این شاخه از ریاضیات هوش مصنوعی می توان میزان حساسیت یک تابع به ورودی های متفاوت را سنجید.
مهم ترین مباحث حساب دیفرانسیل و انتگرال
- مشتقات
- الگوریتم های گرادیان
- ماتریس
مشتقات: قوانین، مشتقات هذلولی و مشتقات جزئی. الگوریتم های گرادیان: حداکثر و حداقل محلی یا جهانی، نقاط زین، توابع محدب، دسته ها و دسته های کوچک، نزول گرادیان تصادفی و مقایسه عملکرد. ماتریس: عملگرهای مشتق مختلف مثل گرادیانت، ژاکوبین، هسین و لاپلاسی.
کاربرد مشتق و انتگرال را می توان در پیدا کردن کمترین خطای محلی و بهینه سازی مدل و به روز رسانی وزن های شبکه عصبی ملاحظه کرد. در الگوریتم گرادیان کاهشی (Gradient Descent) از مشتق جزئی برای پیدا کردن وزن های بهینه شبکه عصبی استفاده می شود.
احتمالاتزمانی که حرف از فرضیه در میان است کاربرد احتمالات را می توان ملاحظه کرد. به عبارتی زمانی که فرضیه ای را برای یک مسئله در نظر می گیریم، درباره احتمال یا شانس رخداد آن فرضیه صحبت می کنیم. احتمالات شانس رخداد یک رویداد را در قالب اعداد به ما نشان می دهد.
مهم ترین مباحث احتمالات
- متغیر تصادفی
- فضای نمونه
- آزمایش تصادفی
- رویداد
- تخمین بیشترین احتمال
- قضیه بیز
- توزیع های آماری
- احتمال شرطی
- احتمال حاشیه ای
- احتمال مشنرک
الگوریتم های یادگیری ماشین نظیر دسته بندی بیز ساده (Naive Bayes Classifier) بر پایه احتمالات به دسته بندی داده ها می پردازد. از دیگر کاربردهای احتمالات می توان به بهینه سازی مدل و تابع هزینه اشاره کرد.
آماربا استفاده از مباحث آمار می توان مسئله را تجزیه و تحلیل کرد و فرضیه ای را در نظر گرفت که با استفاده از آن بتوان درباره داده های جدید تصمیم گرفت. به عبارتی از علم آمار می توان در جمع آوری داده ها، تحلیل و تفسیر آنها و باز نمایی شان استفاده کرد.
مهم ترین مباحث آمار
- روش های نمونه گیری
- اعداد پرت
- شاخص های آمار توصیفی
با کمک مباحث آماری می توان میزان تاثیر فرضیه در نظر گرفته شده برای مسئله را برای داده های گردآوری شده مورد آزمون قرار داد.
ریاضیات گسستهیکی دیگر از مباحث مهم ریاضیات هوش مصنوعی، ریاضیات گسسته است که مفاهیمی همچون اعداد صحیح، مجموعه ها، نمودارها، منطق و الگوریتم ها را شامل می شود. دلیل اهمیت ریاضیات گسسته در برنامه نویسی این است که بسیاری از مباحث آن در طراحی و تجزیه و تحلیل و پیاده سازی الگوریتم های یادگیری ماشین کاربرد دارد. با کمک مفاهیم ریاضیات گسسته می توان به خلاصه سازی و توصیف داده ها پرداخت. همچنین دسته بندی و خوشه بندی داده ها و تخمین چگالی آنها را با استفاده از ریاضیات گسسته می توان انجام داد. در این مبحث از ریاضیات به انواع مدل های گراف و مفاهیمی همچون زنجیره و فرآیند مارکوف (Markov Model) تابع هش یا درهم سازی، جستجوی ساختمان داده های درخت و گراف، مرتب کردن داده ها، کدگذاری داده ها، فشرده سازی داده ها و تجزیه داده ها پرداخته می شود.
نظریه اطلاعاتنظریه اطلاع روشی برای اندازه گیری مقدار اطلاعات است. اطلاعات می تواند شامل کلمات، تصاویر، صوت یا اعداد باشد. این شاخه از ریاضیات مورد نیاز هوش مصنوعی به ما کمک می کند تا بفهمیم چه میزان اطلاعات در اختیار داریم. آنتروپی اطلاعات (Information Entropy) یکی از اصلی ترین مباحث نظریه اطلاعات است که بر اساس این مفهوم الگوریتم درخت تصمیم (Decision Tree) روال تصمیم گیری درباره داده ها را انجام می دهد. اصطلاح آنتروپی متقاطع (Cross Entropy) از دیگر مفاهیم مهمی است که برای مقایسه توزیع های احتمالاتی به کار می رود. کاربرد این مفهوم را در تابع هزینه مدل هایی نظیر رگرسیون خطی ملاحظه می کنیم. همچنین در حوزه یادگیری عمیق، شبکه های عصبی پیچشی (Convolutional Neural Networks) دارای لایه ای به نام تابع بیشینه هموار (Softmax) هستند که از تابع هزینه Cross Entropy استفاده می کنند.
از دیگر مفاهیم مهم حوزه نظریه اطلاعات که در هوش مصنوعی کاربرد دارد، می توان به اطلاعات متقابل (Mutual Information) اشاره کرد. این مفهوم میزان وابستگی دو توزیع احتمالاتی یا دو متغیر تصادفی را نسبت به یکدیگر می سنجد. کاربرد این مفهوم را می توان در زمینه انتخاب ویژگی (Feature Selection) و شبکه های بیز ملاحظه کرد.
کتاب ریاضیات ضروری برای هوش مصنوعییکی از کتاب های این حوزه، کتاب ریاضیات ضروری برای هوش مصنوعی (Essential Math for AI) اثر حلا نلسون هست که در سال ۲۰۲۳ به چاپ رسیده است. این کتاب ۱۴ فصل دارد و به مباحث ریاضیات مورد نیاز در هوش مصنوعی می پردازد. کتاب ریاضیات ضروری هوش مصنوعی برای افرادی که در حوزه هوش مصنوعی و علم داده فعالیت دارند و می خواهند تفکر ریاضی خود را تقویت کنند، مناسب است. این کتاب یک کتاب کدنویسی یا یک کتاب آموزش ریاضی نیست، بلکه تنها تأکید بر مفاهیم ریاضی، شهود و درک کلی مباحث مورد نیاز آن در هوش مصنوعی را دارد.