پژوهش –390

یکشنبه 7 آبان 1396 ساعت 18:09
260007774377551-1- مقدمهشیمی محاسباتی شاخه ای از دانش شیمی است که سعی در حل مسائل شیمی با کمک رایانه ها دارد. در این رشته، از رایانه ها برای پیش بینی ساختار مولکولی، خواص مولکولی و واکنش های شیمیایی استفاده می شود. […]

  

پژوهش –390

پژوهش –390

پژوهش –390

همچنین بهترین توصیف گرها عبارتند :
در همبستگی 0.3:
Meaning Descriptor group Descriptor symbol
3D-MoRSE - signal 23 / weighted by atomic masses 3D-MoRSE (3D) Mor23m
everage-weighted autocorrelation of lag 5 / weighted by atomic masses GETAWAY (3D) HATS5m
در همبستگی 0.4:
Meaning Descriptor group Descriptor symbol
G total symmetry index / weighted by atomic masses WHIM (3D)
Gm
leverage-weighted autocorrelation of lag 5 / weighted by atomic masses GETAWAY (3D) HATS5m
.کلمات کلیدی: دیابت نوع 2، مدل QSAR، ژنتیک الگوریتم (GA)، شبکه عصبی مصنوعی (ANN)،
GA-MLR،GA-PCR ،GA-PLS

-23854649108فصل اول
کلیات
0فصل اول
کلیات
centercenter
26000777437755
1-1- مقدمهشیمی محاسباتی شاخه ای از دانش شیمی است که سعی در حل مسائل شیمی با کمک رایانه ها دارد. در این رشته، از رایانه ها برای پیش بینی ساختار مولکولی، خواص مولکولی و واکنش های شیمیایی استفاده می شود. در این رشته از نتایج شیمی محض که در قالب برنامه های موثر کامپیوتری درآمده اند برای محاسبه ساختار و خواص مولکول ها استفاده می شود، در حالی که نتایج آنها معمولا کامل کننده اطلاعات بدست آمده از آزمایش های شیمیایی هستند، اما در برخی موارد می تواند منجر به پیش بینی پدیده های مشاهده نشده شیمیایی شود.
بنابراین شیمی محاسباتی می تواند به شیمی آزمایشگاهی کمک کرده و در یافتن موضوعات جدید شیمیایی با شیمی تجربی رقابت نماید سیمای شیمی محاسباتی شامل مدل سازی مولکولی، روش های محاسباتی و طراحی مولکول به کمک کامپیوتر و همچنین داده های شیمیایی و طراحی سنتزهای آلی می باشد، همچنین از این رشته به گستردگی برای طراحی داروها، کاتالیست ها و مواد نو استفاده می شود ]1[.
1-2- کمومتریکسبرای درک مکانیسم فرآیندهای مختلف شیمیایی، کشف و توسعه مواد جدید، حفظ محیط زیست و زمینه‎های دیگر شیمی، هنوز توانایی حل مسائل به طور کامل وجود ندارد و برای عملی کردن بعضی از مسائل، نیاز به سیستم های بسیار پیچیده ای است که انجام آنها در گرو صرف هزینه های بسیار و مطالعات گسترده است. درجهت حل این مشکل، روش های محاسباتی کمومتریکس می توانند مفید باشند. تجزیه و تحلیل آماری و ریاضی داده های شیمیایی معمولاً تحت عنوان کمومتریکس یاد می شود. به عبارتی دیگر کمومتریکس یک روش کارآمد برای خلاصه کردن اطلاعات مفید از یک سری داده مشخص و پیش بینی سری دیگر داده هاست. در حقیقت هدف کمومتریکس، بهبود بخشیدن فرآیندهای اندازه گیری و استخراج اطلاعات شیمیایی مفیدتر از داده های اندازه گیری شده فیزیکی و شیمیایی است. کمومتریکس اولین بار توسط دانشمنـد سوئـدی به نام ولـد در ســال 1972 به کـار گــرفته شد و توسط کووالسکی توسعه داده شد و درسال 1974 انجمن بین المللی کمومتریکس تأسیس گردید. درسال 1974 در ایتالیا، دو گروه از دانشمندان به نام های فورینا و کلمنتی شروع به فعالیت در این زمینه کردند و از سال 1980 دانش کمومتریکس خیلی سریع توسعه یافت ]2[. چندیــن تعریف بــرای کمومتــریکس بیــان شده است کـه غالبــاً درمتــن های تجزیــه ای بــه کار می روند. یکی از جامع ترین تعاریف به صورت زیر است:
کمومتریکس شاخه ای از شیمی است که از ریاضی، آمار و منطق برای دستیابی به نتایج زیر استفاده می کند:
الف ) فرآیندهای تجربی بهینه را طراحی و انتخاب کند.
ب ) حداکثر اطلاعات شیمیایی قابل حصول را از تحلیل اطلاعات شیمیایی فراهم کند.
ج ) اطلاعات بیشتری درمورد سیستم های شیمیایی بدست آورد.
1-2-1- کاربردهای کمومتریکسکمومتریکس درشاخه های مختلف شیمی مورد استفاده قرارمی گیـرد که بـرخی از این کاربردها شامل کنترل فرآیندها، تجزیه و تحلیل و شناخت الگوها، پردازش علائم و بهینه کردن شرایط می باشد. یکی از زمینه های مهم کاربرد کمومتریکس در مطالعاتی است که خواص مولکول ها را به ویژگی های ساختاری آنها نسبت می دهد. یکی از مهمترین کاربردهای کمومتریکس ارتباط کمی ساختارـ فعالیت است که با آن می توان مدل های ریاضی، ساختار شیمیایی، فعالیت بیولوژیکی، الکترونیکی و... را با این روش محاسبه و تعیین کرد. هدف QSAR، ایجاد رابطه ای منطقی بین کمیت ها و یا خواص ترکیبات (فعالیت) و ساختار شیمیایی آنها است و این قانون برای مولکول های جدید مورد استفاده قرار می گیرد. نتایج این مطالعات علاوه بر شفاف سازی نحوه ارتباط بین خواص مولکول ها و ویژگی های ساختمانی آنها به پژوهشگران در پیش بینی رفتار مولکول های جدید براساس رفتار مولکول های مشابـه کمک می کند.
1-3- مزایای روش های محاسباتی نسبت به روش های آزمایشگاهیاستفاده از روش های محاسباتی به جای استفاده از روش های آزمایشگاهی حاوی مزایای زیر است:
می توان مدل های مناسبی از ساختار به وجود آورد. (ساختار بهینه)
می توان ساختار های جدید از این طریق طراحی کرد.
می توان سنتزهایی که تنها با افزایش صورت می گیرد به دست آورد.
ویژگی طرح آزمایشی که با استفاده از نمایش ساختار مطلوب به دست می آید به محقق این امکان را می‎دهد تا بتواند ساختارهای جدید را در فضای مجازی امتحان کند وهمین امر کار آزمایشگاهی را با بیشترین بازده برای شیمیدان فراهم می کند.
1-4- QSARنتایج مطالعات QSAR علاوه بر شفاف سازی نحوه ارتباط بین خواص مولکول‌ ها و ویژگی‌ های ساختمانی آنها به پژوهشگران در پیش‌بینی رفتار مولکول ‌های جدید براساس رفتار مولکول ‌های مشابه کمک می‌کند. به تمامی ابــزارها و روش هایـی که به این منظـور مـورد استفـاده قرار می گیرند، روش های پارامتری گویند. در روش‌ های پارامتری سعی می‌شود بین یک سری توصیف کننده ‌های مولکولی با فعالیت یا خاصیت مورد نظر ارتباط منطقی برقرار نمایند. توصیف‌کننده ‌های مولکولی که به این منظور استفاده می‌شوند، حاوی مقادیر عددی می‌باشند که جنبه‌ های مختلف ساختاری مولکول را به طور کمی نشان می‌دهند. وقتی خصوصیات ساختاری گونه‌ها و فعالیت آنها توسط اعداد و ارقام بیان می‌شود می‌توان رابطه ریاضی یا کمی بین ساختار و فعالیت گونه ایجاد کرد، این رابطه می‌تواند برای پیش بینی پاسخ بیولوژیکی یا شیمیایی دیگر ساختارها مورد استفاده قرار گیرد ]3[.
1-5- رگرسیوناگر بخواهیم واژه رگرسیون را از لحاظ لغوی تعریف نماییم، این واژه در فرهنگ لغت به معنی پسروی، برگشت و بازگشت است. اما اگرآن را از دید آمار و ریاضیات تعریف کنیم اغلب جهت رساندن مفهوم "بازگشت به یک مقدار متوسط یا میانگین” به کار می رود، بدین معنی که برخی پدیده ها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل می کنند. در حقیقت تحلیل رگرسیونی فن و تکنیکی آماری برای بررسی و مدل سازی ارتباط بین متغیرهاست. رگرسیون تقریباً در هر زمینه ای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیش بینی مورد نیاز است. می توان گفت تحلیل رگرسیونی، پرکاربردترین روش در بین تکنیک های آماری است. برای انجام یک تحلیل رگرسیونی ابتدا تحلیلگر حدس می زند که بین دو متغیر، نوعی ارتباط وجود دارد، در حقیقت حدس می‎زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع آوری اطلاعات کمی از دو متغیر می پردازد و این داده ها را به صورت نقاطی در یک نمودار دو بعدی رسم می کند. همانطور که بیان گردید رگرسیون یکی از مهمترین تکنیک ها برای تحلیل داده ها و استخراج اطلاعات است، اما نکته ای که باعث گردیده این تکنیک از جایگاه مهمی در تحلیل ها برخوردار باشد شیوه های مختلف تحلیل های رگرسیونی است که این تنوع باعث شده که بتوان به راحتی هر نوع داده ای (اغلب از نوع داده های پیوسته) را تحلیل کرد و به راحتی نتیجه گیری نمود، در ادامه هریک از این روش ها به طور کامل تبیین خواهد گردید. علت دیگری که باعث شده این روش علاقه مندان بیشتری پیدا کنند، نرم افزارهای متنوعی است که قابلیت انجام این تحلیل ها را دارند، به عنوان مثال می توان نرم افزار اکسل و اس پی اس اس ، اس- پلاس ، اس ای اس و ... نام برد ]4[.
1-6- روش های پارامتریامروزه درکمومتریکس از روش های مختلف ریاضی و آماری مانند کالیبراسیون یک متغیره، کالیبراسیون چند متغیره، رگرسیون خطی چندگانه(MLR) ، حداقل مربعات کلاسیک (CLS)، حداقل مربعات معکوس (ILS)، حداقل مربعات جزئی (PLS)، آنالیز اجزاء اصلی (PCA)، رگرسیون اجزاء اصلی (PCR) و رگرسیون چند متغیره غیر خطی (MNR) استفاده شده است. همچنین در پیشرفت های دو دهه اخیر از شبکه عصبی مصنوعی (ANN)، منطق فازی و الگوریتم ژنتیکی (GA) نیز استفاده شده است. این روش‎ها جزء دسته ای از علوم کامپیوتر به نام هوش مصنوعی (AI) قـرار می گیرند که تفاوت اساسی با سایر روش های محاسباتی و همچنین با یکدیگر دارند. در سیستم های ریاضی متداول، دانسته ها به صورت قواعد روشن و از پیش مشخص شده ای در سیستـم وجود دارد، در حالی که این سیستم ها قواعد را توسط آموزش از مثال هایی که به آنها داده می شوند فرا می گیرند. از میان روش های فوق استفاده از شبکه های عصبی مصنوعی در شیمی نقش برجسته ای پیدا کرده و کاربرد آن در شیمی به سرعت درحال افزایش است. از شبکه های عصبی مصنوعی به خوبی می توان در شناخت الگوها و طبقه بندی داده ها استفاده کرد. همچنین از این شبکه ها در مطالعات QSAR، هنگامی که ارتباط بین توصیف کننده ها و کمیت مورد مدل سازی پیچیده و غیرخطی بوده و یا اینکه پردازش سریع حجم وسیعی از اطلاعات مورد نیاز می باشد می‎توان به خوبی استفاده کرد ]5[. توضیحاتی راجع به انواع رگرسیون ها در زیر آماده است:
1-6-1- کالیبراسیون یک متغیره و چند متغیرهمراحل کالیبراسیون معمولا شامل طراحی آزمایش، انتخاب مدل، تخمین پارامترها و پیش‌بینی مجهولات می‌باشد. در کالیبراسیون یک متغیره، امکان تصحیح مزاحم‌ها بدون وارد کردن اطلاعات اضافی وجود ندارد، در حالی که در روش‌های چند متغیره قادر به جدا کردن اطلاعات مفید از اطلاعات نامناسب مانند خطا می‌باشند، بدون این که اطلاعات اضافی دیگری برای این کار لازم می‌باشد ]6[.
1-6-2- حداقل مربعات کلاسیک(CLS)روش بسیار محبوب برای محاسبه برآورد پارامترها و تناسب داده هاست. این روش یکی از قدیمی ترین تکنیک های آماریست که در داده های چند متغیره و در مدل های طیف سنجی مورد استفاده قرار می گیرد ]7[.
1-6-3- حداقل مربعات معکوس(ILS)واژه حداقل مربعات توصیفی از یک رویکرد برای حل معادلات از روی عدم دقت در مفهوم تقریبی است. به جای حل دقیق معادلات، به دنبال به حداقل رساندن مجموع مربعات باقیمانده می باشد. حداقل معیار مربع دارای تفسیرهای مهم آماری است. یکی از این تفسیرهای مهم زمانی است که مفروضات مناسب، احتمالاتی در مورد توزیع خطا زمینه ای ایجاد نمایند که در این حالت حداقل مربعات، برآورد حداکثر احتمال از پارامترهای شناخته شده را بدست می دهد ]8[.
1-6-4- رگرسیون خطی چندگانه (MLR)با روش های مطالعاتی چند متغیره، می توان همزمان به بررسی و تحلیل چندین متغیر مختلف پرداخت. برای دسترسی به نتایج مطلوب تر و درست تر از این روش ها، نیازمند به نمونه های فراوان و در عین حال درست است زیرا این روش ها در مقابل اطلاعات نادرست، حساسیت بالایی دارند و ورود چنین داده هایی ممکن است منجر به بروز خطاهای بزرگی در نتایج به دست آمده شود. افزون بر این برای استفاده از این روش ها، متغیرها باید توزیع نرمال داشته باشند و تغییر آنها از یک رابطه خطی پیروی کند ]9[.
رگرسیون چند متغیره در حقیقت، ارتباط بین یک سری از متغیرهای مستقل را با یک متغیر مورد نظر بیان می کنند. در صورت وجود متغیرهای مستقل x1, x2, ..., xnاگر بخواهیم ارتباط خطی بین آنها و متغییر yکه وابسته به آنهاست ایجاد کنیم، رابطه زیر باید بین آنها برقرار باشد:
(2-1) y = a0 + a1x1 + a2x2 + … + anxn + e
که در این رابطه از مقادیر a1, a2, …, anبا عنوان ضرایب رگرسیون یاد می شود. این ضرایب، ضرایب نامشخصی بوده که در حقیقت، مسئول برآورد پارامتر وابسته هستند. در صورتی که از طرفین رابطه فوق امید ریاضی گرفته شود، به دلیل اینکه امید ریاضی مقدار خطای e برابر با صفر است، می توان نوشت:
(3-1) E(y) = a0 + a1x1 + a2x2 + … + anxn
که E(y)در حقیقت مقدار مورد انتظار تابع، تحت تأثیر و ورود مقادیرمتغیرهای x1, x2, ..., xn است.
1-6-5- حداقل مربعات جزئی(PLS)به منظور اشتقاق یک تابع انتقالی بر اساس متغیرهای مستقل و وابسته مورد نظر، از روش رگرسیون حداقل مربعات جزئی استفاده می گردد. این روش یکی از روش های چند متغیره است که در هنگام بروز هم خطی بین متغیرهای مستقل استفاده می شود. در این روش برای تشکیل رابطه بین متغیر وابسته و متغیرهای مستقل، متغیرهای جدیدی ساخته می شود که آنها را مؤلفه یا فاکتور می نامند. هر یک از این مؤلفه ها یک ترکیب خطی از متغیرهای مستقل اولیه می باشد. سپس از روش های رگرسیونی استاندارد برای تعیین معادلاتی که این مؤلفه ها را به متغیر وابسته ارتباط دهند استفاده می شود. شایان ذکر است که تعداد این مؤلفه‎ها از تعداد متغیرهای مستقل اولیه کمتر بوده و همچنین بین آنها رابطه خطی وجود ندارد. در واقع روش حداقل مربعات جزئی با بکار بردن مؤلفه هایی با قدرت پیش بینی بالا که تعداد آنها از متغیرهای اولیه کمتر است، بعد مسأله را نیز کاهش می دهد. یکی از مزایای این روش به روش رگرسیون خطی چندگانه این است که می توان از متغیرهایی که از توزیع نرمال تبعیت نمی کند نیز استفاده کرد ]10[.
1-6-6- آنالیز اجزاء اصلی(PCA)این روش یکی از الگوهای تشخیص و شناسایی (تشخیص هویت) در یک مجموعه اطلاعات است. در این روش اطلاعات را براساس شباهت ها و تفاوت هایشان بیان می کنند. از آن جا که در اطلاعات از ابعاد بالا، نقشه و طرح خاصی را به سختی می توان در داده ها پیدا کرد. در حقیقت آنالیز اجزای اصلی ارتباط بین داده ها را کشف می کند و در جایی که نعمت نمایش گرافیکی در دسترس نیست، آنالیز اجزای اصلی یک ابزار نیرومند برای آنالیز اطلاعات است. دیگر مزیت اصلی آنالیز اجزای اصلی این است که شما یک بار این الگو را در داده ها پیدا می کنید و با کاهش تعداد ابعاد، بدون آن که مقدار زیادی از اطلاعات را از دست دهید این اطلاعات را فشرده می کنید. هدف آنالیز اجزای اصلی خلاصه کردن داده هاست و به عنوان یک وسیله دسته بندی کننده اطلاعات مورد توجه نیست، از این تکنیک در فشرده سازی تصاویر استفاده می‎شود. یکی از کاربردهای مطلوب آنالیز اجزای اصلی، استفاده از آن به عنوان ابزاری کمکی، در آموزش شبکه های عصبی است. معمولا قبل از آغاز آموزش شبکه های عصبی یکسری پیش پردازش برروی داده ها انجام می شود که باعث افزایش کارایی شبکه های عصبی می شود مانند: نرمال کردن داده ها و قراردادن آن‎ها در یک فاصله مشخص مثلا بین -1 و 1 ]11[.
1-6-7- رگرسیون اجزاء اصلی (PCR)عبارتست از تجزیه و تحلیل رگرسیونی با آنالیز اجزای اصلی زمانی که ضرایب رگرسیون برآورد شده باشد. این روش برای غلبه بر مشکلاتی که متغیر های بدست امده نزدیک به راستا بودن هستند، مورد استفاده قرار می گیرد همچنین در این روش به جای استفاده از الگوهای متغیر وابسته و متغیرهای مستقل به طور مستقیم، از متغیرهای مستقل استفاده می شود. به طور معمول با استفاده از یک زیر مجموعه از اجزای اصلی در رگرسیون ساخته شده و منظم می گردد. اغلب اجزای اصلی با بالاترین واریانس انتخاب می شود، با این حال ممکن است که کمترین واریانس اجزای اصلی نیز مهم باشد حتی در برخی موارد از اهمیت بیشتری برخوردار است و بعد محاسبات پیش بینی حاصل می شود.
این روش رگراسیونی را به سه مرحله تقسیم می کنند که عبارتند از:
1. گام اول اجزای تجزیه و تحلیل در جدول متغیر های توزیعی باشد.
2. گام دوم برای اجرای عادی رگرسیون حداقل مربعات (رگرسیون خطی) بر روی اجزای انتخاب شده این است که عواملی که در ارتباط با متغیر وابسته هستند انتخاب شوند.
3. در نهایت پارامترهای مدل را برای انتخاب متغیرهای توزیعی محاسبه کند ]12[.

1-6-8- رگرسیون چند متغیره غیر خطی(MNR)این روش یکی از تکنیک های یادگیری نظارتی و در حالتی که نتایج خروجی به صورت دوتایی هستند،
مورد توجه قرار می گیرد، در کل زمانی که نتایج خروجی به صورت دوتایی هستند رگرسیون خطی خیلی
کارا نیست، دراین حالت استفاده از این تکنیک مناسب تر است. نکته دیگر اینکه این روش یک تکنیک رگرسیون غیر خطی است و لزومی ندارد که داده ها حالت خطی داشته باشند. اگر بخواهیم دلیل استفاده رگرسیون لجستیک را بیان کنیم باید این گونه بحث کنیم در رگرسیون خطی علاوه بر اینکه نتایج خروجی باید به صورت عددی باشد، متغیرها هم باید به صورت عددی باشد بنابراین حالت هایی که به صورت مقایسه ایی هستند باید به حالت عددی تغییر شکل پیدا کنند، مثلا جنسیت افراد از حالت زن و مرد به ترتیب به حالت های 0 و 1 تغییر پیدا می کند. به علت اینکه خروجی متغیر بصورت دوتایی می باشد اساس رگرسیون خطی در این حالت ایراد پیدا می کند و ارزش قیدی که بر روی متغیر وابسته قرار می گیرد توسط معادله رگرسیون در نظر گرفته نمی شود. در واقع چون رگرسیون خطی معادله یک خط را ترسیم می کند نمی تواند حالت مثبت و منفی یا به عبارتی صفر و یک را در نظر بگیرد به همین دلیل برای اینکه بتوان حالت های دوتایی را هم در نظر گرفت باید شکل معادله را تغییر داد با این تغییر شکل معادله رگرسیون، احتمال اتفاق افتادن یا اتفاق نیفتادن یک واقعه را بدست می دهد. با تغییر شکل رگرسیون خطی به حالت رگرسیون لجستیک این مشکل حل می شود، با توجه به لگاریتمی بودن معادله نمودارش غیر خطی خواهد بود ]9[.
.
1-6-9- منطق فازی
فازی به معنای گنگ و مبهم و تار است. منطق فازی یک منطق ریاضی است که خیلی ها دوست دارند آن را مقابل منطق صفر و یک ریاضی قرار دهند. این منطق در سال 1965 توسط یک ریاضیدان ایرانی بنام دکتر لطفی زاده در آمریکا عرضه شد و در حال حاضر بعنوان روشی فوق العاده برای شناسایی و کنترل سیستم‎هایی که اطلاعاتی دقیقی از درون آنها در اختیار نیست، بکار می رود. در واقع امتیاز منطق و روش‎های فازی زمانی مشخص می گردد که با سیستم های نسبتا فوق العاده پیچیده و با دینامیک بالا درگیر باشیم. در واقع بیان کننده این واقعیت است که لزومی ندارد که یک گزینه درست یا غلط باشد (به عبارتی صفر یا یک باشد) مثلا ممکن است گزینه 0.7 درست باشد ]13[.

1-6-9-1-کاربرد های منطق فازیاحتمالا راجع به یخچال های فازی یا دوربین های فیلمبرداری فازی و یا ماشین لباسشویی فازی مطالبی شنیده اید. چند کاربرد دیگر ]14[ این منطق عبارتند از:
ترمز های ABS و سیستم کروز
دوربین ها
ماشین ظرف شویی
آسانسور ها
ماشین لباسشویی
بازی های رایانه ای
شناخت الگو ها
سیستم های تهویه
1-6-10- شبکه های عصبی مصنوعی (ANN)
شبکه‌های عصبی مصنوعی یا به زبان ساده‌تر شبکه‌های عصبی، سیستم‌ها و روش‌ های محاسباتی نوینی برای یادگیری ماشینی، نمایش دانش و در انتها اعمال دانش به دست آمده در جهت پیش‌بینی پاسخ‌ های خروجی از سامانه‌های پیچیده هستند. ایده اصلی این گونه شبکه ‌ها (تا حدودی) الهام ‌گرفته از شیوه کارکرد سیستم عصبی زیستی، برای پردازش داده‌ها و اطلاعات به منظور یادگیری و ایجاد دانش قرار دارد. عنصر کلیدی این ایده، ایجاد ساختارهایی جدید برای سامانه های پردازش اطلاعات است. این سیستم از شمار زیادی عناصر پردازشی فوق العاده بهم ‌پیوسته با نام نورون تشکیل شده که برای حل یک مسأله با هم هماهنگ عمل می‌کنند و توسط سیناپس‎ها (ارتباطات الکترومغناطیسی) اطلاعات را منتقل می‎کنند. در این شبکه‌ها اگر یک سلول آسیب ببیند بقیه سلول‎ها می‌توانند نبود آنرا جبران کرده و نیز در بازسازی آن سهیم باشند. این شبکه‌ها قادر به یادگیری‎اند، مثلا با اعمال سوزش به سلول‎ های عصبی لامسه، سلول‎ ها یاد می‌گیرند که به طرف جسم داغ نروند و با این الگوریتم سیستم می‌آموزد که خطای خود را اصلاح کند. یادگیری در این سیستم ‎ها به صورت تطبیقی صورت می‌گیرد، یعنی با استفاده ازمثال‎ ها وزن سیناپس ‎ها به گونه‌ای تغییر می‌کند که در صورت دادن ورودی ‎های جدید، سیستم پاسخ درستی تولید کند. با استفاده از دانش برنامه‌نویسی رایانه می‌توان ساختار داده‌ای طراحی کرد که همانند یک نورون عمل نماید. سپس با ایجاد شبکه‌ای از این نورون ‌های مصنوعی به هم پیوسته، ایجاد یک الگوریتم آموزشی برای شبکه و اعمال این الگوریتم به شبکه آن را آموزش داد. این شبکه‌ ها برای تخمین و تقریب کارایی بسیار بالایی از خود نشان داده‌اند. گستره کاربرد این مدل‌های ریاضی بر گرفته از عملکرد مغز انسان، بسیار وسیع می‌باشد که به عنوان چند نمونه کوچک می‌توان استفاده از این ابزار ریاضی در پردازش سیگنال ‌های بیولوژیکی، مخابراتی و الکترونیکی تا کمک در نجوم و فضا نوردی را نام برد. اگر یک شبکه را هم‌ارز با یک گراف بدانیم، فرآیند آموزش شبکه تعیین نمودن وزن هر یال و پایه اولیه خواهد بود. هدف شبکه عصبی مصنوعی ارزیابی قابل اطمینان بودن مدل QSAR است و به ارتباط غیر خطی بین متغیر های ورودی و خروجی توجه دارد.
شبکه عصبی مصنوعی یک سامانه پردازشی داده‌هاست که از مغز انسان ایده گرفته و پردازش داده‌ها را به عهده پردازنده ‌های کوچک و بسیار زیادی سپرده که به صورت شبکه‌ای به هم پیوسته و موازی با یکدیگر رفتار می‌کنند تا یک مسئله را حل نمایند. در این شبکه‌ ها به کمک دانش برنامه نویسی، ساختار داده‌ای طراحی می‌شود که می‌تواند همانند نورون عمل کند. که به این ساختارداده گره گفته می‌شود. بعد با ایجاد شبکه‌ای بین این گره‌ها و اعمال یک الگوریتم آموزشی به آن، شبکه را آموزش می‌دهند. در این حافظه یا شبکه عصبی گره‌ها دارای دو حالت فعال (روشن یا 1) و غیرفعال (خاموش یا 0) اند و هر یال (سیناپس یا ارتباط بین گره‌ها) دارای یک وزن است. یال‌ های با وزن مثبت، موجب تحریک یا فعال کردن گره غیر فعال بعدی می‌شوند و یال‌ های با وزن منفی، گره متصل بعدی را غیر فعال یا مهار (در صورتی که فعال بوده باشد) می‌کنند. شبکه‌ های عصبی با توانایی قابل توجه خود در استنتاج نتایج از داده‌ها پیچیده می‌توانند در استخراج الگو ها و شناسایی گرایش ‌های مختلفی که برای انسان‌ ها و کامپیوتر شناسایی آنها بسیار دشوار است استفاده شوند ]15[.
1-6-10-1- ویژگی های شبکه عصبی
یکی از مهم ترین ویژگی های شبکه عصبی مصنوعی اینست که شبکه های فوق، سیستمی برنامه ریزی شده با قواعد از پیش تعیین شده نیستند و می توانند طی فرآیندی که آموزش نامیده می شود ساختار درونی خود را به صورت تجربی به نحوی تنظیم کنند که بهترین پاسخ ممکن را برای داده های ورودی ایجاد کند. استفاده از شبکه های عصبی مصنوعی به جای روش رگرسیون خطی چندتایی در مطالعات QSAR، به خصوص هنگامی که ارتباط بین توصیف کننـده و فعالیـت مورد نظـر خطـی نبوده و یا اینکه بین آنها بر هم کنش هایی وجود داشتـه باشد باعث بهبـود مدل حاصلـه خواهــد شــد. یک شبکه عصبی شامل اجزای سازنده لایه‌ ها و وزن ‌ها می‌باشد. رفتار شبکه نیز وابسته به ارتباط بین اعضا است. شبکه عصبی مصنوعی، از مجموعه‌ای از نورون ‌های عصبی تشکیل می‌شود. مهم‌ترین عواملی که گونه‌ها و کاربرد های شبکه‌های عصبی را از یکدیگر متمایز می‌سازند، نوع نورون به‌کارگرفته شده، چیدمان یا معماری شبکه، بازه ورودی/ خروجی‌ها است. در معماری یک شبکه تعداد لایه ‌ها و اتصالات بین آنها مهم است. ورودی‌ های شبکه با نام «لایه ورودی» و خروجی های شبکه با نام «لایه خروجی» و در صورت نیاز، لایه‌های میان این دو «لایه پنهان» نامیده می‌شود. در صورتی که خروجی نورون ‌های هر لایه به همه نورون‌ های لایه بعدی وارد شده باشد، اتصالات را کامل می‌نامند، اما اغلب خروجی‌ها به‌صورت تصادفی با توزیع نرمال در نظر گرفته می‌شود. در حالت کلی در شبکه‌های عصبی سه نوع لایه نورونی وجود دارد:
1. لایه ورودی: دریافت اطلاعات خامی که به شبکه تغذیه شده‌ است.
2. لایه ‌های پنهان: عملکرد این لایه‌ها به وسیله ورودی‌ها و وزن ارتباط بین آنها و لایه‌های پنهان تعیین می‌شود. وزن‌های بین واحدهای ورودی و پنهان تعیین می‌کند که چه وقت یک واحد پنهان باید فعال شود.
3. لایه خروجی: عملکرد واحد خروجی بسته به فعالیت واحد پنهان و وزن ارتباط بین واحد پنهان و خروجی است. شکل(1-1) شمای کلی یک شبکه عصبی مصنوعی را نشان می‌دهد:
199453544450
شکل (1- 1) شمای کلی یک شبکه عصبی مصنوعیشبکه‌ های تک لایه و چند لایه‌ای نیز وجود دارند که سازماندهی تک لایه که در آن تمام واحدها به یک لایه اتصال دارند بیشترین مورد استفاده را دارد و پتانسیل محاسباتی بیشتری نسبت به سازماندهی های چند لایه دارد، در شبکه‌ های چند لایه واحدها به وسیله لایه ‌ها شماره گذاری می‌شوند (به جای دنبال کردن شماره گذاری سراسری). هر دو لایه از یک شبکه به وسیله وزن‌ها و در واقع اتصالات با هم ارتباط می‌یابند. در شبکه‌ های عصبی چند نوع اتصال و یا پیوند وزنی وجود دارد:
پیشرو: بیشترین پیوندها از این نوع است که در آن سیگنال ‌ها تنها در یک جهت حرکت می‌کنند. از ورودی به خروجی هیچ بازخوردی (حلقه) وجود ندارد. خروجی هر لایه بر همان لایه تاثیری ندارد.
پسرو: داده‌ها از گره‌های لایه بالا به گره‌های لایه پایین باز خورانده می‌شوند.
جانبی: خروجی گره‌های هر لایه به عنوان ورودی گره‌های همان لایه استفاده می‌شوند ]16[.
1-6-10-2- مزایای شبکه عصبیاز مزایای شبکه‌های عصبی می‌توان موارد زیر را نام برد:
1. یادگیری تطبیقی: توانایی یادگیری اینکه چگونه وظایف خود را بر اساس تجارب اولیه و اطلاعات داده شده به آن انجام دهد در واقع اصلاح شبکه را گویند.
2. خود سازماندهی: یک شبکه عصبی مصنوعی به صورت خودکار سازماندهی و ارائه داده‌هایی که در طول آموزش دریافت کرده را انجام دهد. نورون ‌ها با قاعده یادگیری سازگار شده و پاسخ به ورودی تغییر می‌یابد.
3. عملگرهای بی‌درنگ: محاسبات در شبکه عصبی مصنوعی می‌تواند به صورت موازی و به وسیله سخت ‌افزارهای مخصوصی که طراحی و ساخت آن برای دریافت نتایج بهینه قابلیت‌ های شبکه عصبی مصنوعی است انجام شود.
4. تحمل خطا: با ایجاد خرابی در شبکه مقداری از کارایی کاهش می‌یابد ولی برخی امکانات آن با وجود مشکلات بزرگ همچنان حفظ می‌شود.
5. دسته بندی: شبکه‌ های عصبی قادر به دسته بندی ورودی ‌ها برای دریافت خروجی مناسب هستند.
6. تعمیم دهی: این خاصیت شبکه را قادر می‌سازد تا تنها با برخورد با تعداد محدودی نمونه، یک قانون کلی از آن را به دست آورده، نتایج این آموخته‌ها را به موارد مشاهده از قبل نیز تعمیم دهد. توانایی که در صورت نبود آن سامانه باید بی نهایت واقعیت‌ها و روابط را به خاطر بسپارد.
7. پایداری- انعطاف پذیری: یک شبکه عصبی هم به حد کافی پایدار است تا اطلاعات فراگرفته خود را حفظ کند و هم قابلیت انعطاف و تطبیق را دارد و بدون از دست دادن اطلاعات قبلی می‌تواند موارد جدید را بپذیرد.
1-6-10-3- کاربرد های شبکه عصبیشبکه‌های عصبی مصنوعی دارای دامنه کاربرد وسیعی می‌باشند از جمله سامانه‌های آنالیز ریسک، کنترل هواپیما بدون خلبان، آنالیز کیفیت جوشکاری، آنالیز کیفیت کامپیوتر، آزمایش اتاق اورژانس، اکتشاف نفت و گاز، سامانه‌های تشخیص ترمز کامیون، تخمین ریسک وام، شناسایی طیفی، تشخیص دارو، فرآیندهای کنترل صنعتی، مدیریت خطا، تشخیص صدا، تشخیص هپاتیت، بازیابی اطلاعات راه دور، شناسایی مین‌های زیردریایی، تشخیص اشیاء سه بعدی و دست نوشته‌ها و چهره و ... .
در کل می‌توان کاربردهای شبکه‌های عصبی را به صورت زیر دسته بندی کرد:
تناظر (شبکه الگوهای مغشوش وبه هم ریخته را بازشناسی می‌کند)
خوشه یابی
دسته بندی
شناسایی
بازسازی الگو
تعمیم دهی (به دست آوردن یک پاسخ صحیح برای محرک ورودی که قبلا به شبکه آموزش داده نشده)
بهینه سازی
امروزه شبکه‌های عصبی در کاربردهای مختلفی نظیر مسائل تشخیص الگو که خود شامل مسائلی مانند تشخیص خط، شناسایی گفتار، پردازش تصویر و مسائلی از این دست می‌شود و نیز مسائل دسته بندی مانند دسته بندی متون یا تصاویر، به کار می‌روند. در کنترل یا مدل سازی سامانه‌هایی که ساختار داخلی ناشناخته یا بسیار پیچیده‌ای دارند نیز به صورت روز افزون از شبکه‌های عصبی مصنوعی استفاده می‌شود. به عنوان مثال می‌توان در کنترل ورودی یک موتور از یک شبکه عصبی استفاده نمود که در این صورت شبکه عصبی خود تابع کنترل را یاد خواهد گرفت ]17[.
1-6-11- الگوریتم ژنتیکی (GA)
الگوریتم ژنتیک که به‌عنوان یکی از روش های تصادفی بهینه یابی شناخته شده و در سال ۱۹۶۷توسط جان هالند ابداع شده ‌است. بعدها این روش با تلاش های گلدبرگ در سال ۱۹۸۹ مکان خویش را یافته و امروزه نیز بواسطه توانایی های خویش، جای مناسبی در میان دیگر روش ها دارد. روال بهینه یابی درالگوریتم ژنتیک بر اساس یک روند تصادفی هدایت شده استوار می‌باشد. این روش بر مبنای نظریه تکامل تدریجی و ایده‌های بنیادین داروین پایه گذاری شده است ]18[.

1-6-11-1- قوانین داروینهنگامی که لغت تنازع بقا به کار می‌رود اغلب بار ارزشی منفی آن به ذهن می‌آید، شاید همزمان قانون جنگل به ذهن برسد و حکم بقای قوی‌تر! البته برای آنکه خیالتان راحت شود می‌توانید فکر کنید که همیشه هم قوی‌ترین‌ ها برنده نبوده‌اند مثلا دایناسورها با وجود جثه عظیم و قوی‌تر بودن در طی روندی کاملا طبیعی بازی بقا و ادامه نسل را واگذار کردند درحالی که موجوداتی بسیار ضعیف‌تر از آن ها حیات خویش را ادامه دادند، ظاهرا طبیعت بهترین ‌ها را تنها بر اساس هیکل انتخاب نمی‌کند! در واقع درست‌تر آنست که بگوییم طبیعت مناسب ترین‌ها را انتخاب می‌کند نه بهترین ‌ها. قانون انتخاب طبیعی بدین صورت است که تنها گونه ‌هایی از یک جمعیت ادامه نسل می‌دهند که بهترین خصوصیات را داشته باشند و آنهایی که این خصوصیات را نداشته باشند به تدریج و در طی زمان از بین می‌روند. الگوریتم های ژنتیک از اصول انتخاب طبیعی داروین برای یافتن فرمول بهینه جهت پیش بینی یا تطبیق الگو استفاده می کنند. الگوریتم های ژنتیک اغلب گزینه خوبی برای تکنیک های پیش بینی بر مبنای رگرسیون هستند. مختصراً گفته می شود که الگوریتم ژنتیک یک تکنیک برنامه نویسی است که از تکامل ژنتیکی به عنوان یک الگوی حل مسئله استفاده می کند. مسئله ای که باید حل شود ورودی است و راه حل ها طبق یک الگو کدگذاری می شوند که تابع تناسب نام دارد و هر راه حل کاندیدی که به صورت تصادفی انتخاب می شوند را ارزیابی می کنند ]19[.
1-6-11-2- ویژگی های الگوریتم ژنتیکالگوریتم ژنتیک یک تکنیک جستجو در علم کامپیوتر برای یافتن راه حل بهینه و مسائل جستجو است. الگوریتم های ژنتیک یکی از انواع الگوریتم های تکاملی اند که از علوم زیست شناسی مثل وراثت، جهش، انتخاب ناگهانی، انتخاب طبیعی و ترکیب الهام گرفته شده اند. عموماً راه حل ها به صورت دوتایی 0 و 1 نشان داده می شوند ولی روش های نمایش دیگری هم وجود دارد. تکامل از یک مجموعه کاملاً تصادفی از داده ها شروع می شود و در نسل های بعدی تکرارمی شود و در هر نسل مناسب ترین ها انتخاب می شوند. در این روش ابتدا برای تعدادی ثابت که جمعیت نامیده می‌شود مجموعه‌ای از پارامترهای هدف بصورت اتفاقی تولید می‌شود، پس از اجرای برنامه شبیه ساز عددی را که معرف انحراف معیار و یا برازش آن مجموعه از اطلاعات است را به آن عضو از جمعیت مذکور نسبت می‌دهیم. این عمل را برای تک تک اعضای ایجاد شده تکرار می‌کنیم، سپس با فراخوانی عملگرهای الگوریتم ژنتیک از جمله لقاح، جهش و انتخاب نسل بعد را شکل می‌دهیم و این روال تا ارضای معیار همگرایی ادامه داده خواهد شد. بصورت متداول سه معیار به‌عنوان معیار توقف شمرده می‌شود:
۱. زمان اجرای الگوریتم ۲. تعداد نسل هایی که ایجاد می‌شوند ۳. همگرایی معیار خطا
مثلا یک راه حل برای مسئله مورد نظر، با یک لیست از پارامترها نشان داده می شود که به آن ها کروموزوم یا ژنوم می گویند. کروموزوم ها عموماً به صورت یک رشته ساده از داده ها نمایش داده می شوند، البته انواع ساختمان داده های دیگر هم می توانند مورد استفاده قرار گیرند. در ابتدا چندین مشخصه به صورت تصادفی برای ایجاد نسل اول تولید می شوند. در طول هر نسل، همه مشخصه ها ارزیابی می شوند و مناسب ترین مشخصه ها توسط تابع تناسب اندازه گیری می شوند. گام بعدی ایجاد دومین نسل از جامعه است که بر پایه فرآیندهای انتخاب از روی مشخصه های انتخاب شده با عملگرهای ژنتیکی است سپس برای هر فرد، یک جفت والد انتخاب می شود. معمولاً الگوریتم های ژنتیک یک عدد احتمال اتصال دارد که بین 0.6 و1 است که احتمال به وجود آمدن فرزند را نشان می دهد. ارگانیسم ها با این احتمال با هم دوباره با هم ترکیب می شوند. اتصال 2 کروموزوم فرزند ایجاد می کند، که به نسل بعدی اضافه می شوند. این کارها انجام می شوند تا این که کاندیدهای مناسبی برای جواب، در نسل بعدی پیدا شوند. مرحله بعدی تغییر دادن فرزندان جدید است. الگوریتم های ژنتیک یک احتمال تغییر کوچک وثابت دارند که معمولاً درجه ای در حدود 0.01 یا کمتر دارند. بر اساس این احتمال، کروموزوم های فرزند به طور تصادفی تغییر می کنند یا جهش می یابند. مخصوصاً که جهش در بیت های کروموزوم ساختمان داده مان صورت بگیرد مثالی از جهش در شکل (2-1) مشاهده می شود:
(1 2 3 4 5 6 8 9 7) => (1 8 3 4 5 6 2 9 7)
شکل (2-1):جهش کروموزوماین فرآیند باعث به وجود آمدن نسل جدیدی از کروموزوم ها می شود، که با نسل قبلی متفاوت است. کل فرآیند برای نسل بعدی هم تکرار می شود و جفت ها برای هر ترکیب انتخاب می شوند، جمعیت نسل سوم به وجود می آیند و... این فرآیند تکرار می شود تا این که به آخرین مرحله برسیم.

پژوهش

دسته‌بندی نشده

No description. Please update your profile.

LEAVE COMMENT

نظرات (0)
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)

نام :
ایمیل :
وب/وبلاگ :
ایمیل شما بعد از ثبت نمایش داده نخواهد شد