علمی : استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به … |
(3-25) |
نشان دهنده کل شبکه بدون در نظر گرفتن یال های ورودی به گره ام است. ترم دوم در سمت راست معادله (3-25) باعث می شود که امتیاز والدها با تعداد گره بیشتر مقداری افزایش یابد. به بیان دیگر، این ترم میزان جریمه را برای مجموعه هایی با تعداد گره های بیشتر کاهش می دهد.
تا اینجا فرض شده بود که تنها منبع برای بازسازی شبکه از روی شبکه ساختار فعلی شبکه است. حال اگر فرض شود که یک سری زمانی تولید شده به وسیله شبکه در اختیار است، می توان برای بازیابی شبکه از ترکیب این منبع اطلاعاتی به همراه ساختار شبکه و احتمالاً دانش قبلی در مورد ساختار شبکه استفاده کرد. برای این منظور می توان از ترکیب توابع امتیازدهی (3-25) و (3-6) استفاده کرد. تابع جدید برابر است با:
دانلود کامل پایان نامه در سایت pifo.ir موجود است. |
(3-26) |
نکته قابل توجه دیگر این است که در موقعیتی که در بالا توصیف شده است، می دانیم که یال های شبکه مطمئناً در شبکه اصلی هم وجود دارند. این فرض باعث می شود که ساختار شبکه منبع قابل اعتمادی برای بازیابی شبکه اصلی باشد. اما در عمل، ما چنین اطلاعاتی نداریم و مسئله ساختن شبکه از ابتدا است. در چنین حالتی اضافه کردن یال هایی که اشتباه هستند بسیار محتمل است. زمانی که پیدا کردن بهترین مجموعه والدها برای هر گره از ساختار شبکه مستقل است، اضافه کردن یال های اشتباه تاثیری در بازیابی باقی شبکه ندارند. اما، در روش ارائه شده، اضافه کردن یال های اشتباه بر روی درجه خروجی گره ها تاثیر می گذارند. این تاثیر به نوبه خود باعث تغییر در توزیع (3-24) می شود که این می تواند کل فرآیند بازیابی شبکه را تحت تاثیر قرار دهد.
برای حل این مشکل و کاهش احتمال اضافه کردن یال های اشتباه، حداقل در مراحل ابتدایی فرآیند یادگیری شبکه، الگوریتم ارائه شده یال ها را به صورت افزایشی و طی مراحل مختلف به شبکه اضافه می کند. فرآیند با افزودن یال هایی که باعث ایجاد بیشترین افزایش در امتیاز شبکه می شوند آغاز می شود. بر اساس اطلاعاتی که ما از داده های آموزشی و دانش اولیه داریم، این ها یال هایی هستند که بیشترین اطمینان از وجود آن ها در شبکه اصلی داریم. بعد از افزودن این یال ها، فرض می کنیم که ساختار شبکه ساخته شده در این مرحله حقیقی است و بر اساس این ساختار، احتمال اختصاص یافته به هر گره را در توزیع احتمالی (3-24) دوباره محاسبه می کنیم. در این مرحله دوباره یال هایی که باعث بیشترین افزایش می شوند را به شبکه اضافه کرده، مراحل قبل را تکرار می کنیم.
به صورت دقیق تر فرآیند یاد گیری در الگوریتم ارائه شده بدین صورت است: ابتدا امتیاز مربوط به هر گره، با فرض این که گره ها هیچ والدی ندارند، محاسبه می شود. در گام بعدی بهترین مجموعه والدها برای هر گره بر اساس تابع امتیازدهی (3-26) انتخاب می شود و میزان افزایشی که توسط اضافه کردن یال های مربوطه در امتیاز آن گره ایجاد می شود محاسبه می گردد. بعد از محاسبه میزان تغییر امتیاز برای تمامی گره ها، گره ها بر اساس این میزان افزایش به صورت نزولی مرتب می شوند و 10% گره ها که بیشترین تغییر در امتیاز را دارند انتخاب می شوند.در پایان، یال های مربوط به بهترین والدها برای گره های انتخاب شده به شبکه اضافه می شوند. بعد از افزوده شدن این یال ها احتمال منسوب به هر گره بر اساس (3-24) دوباره محاسبه می شود. در حلقه بعدی الگوریتم، دوباره بهترین مجموعه والدها برای هر گره بر اساس (3-26) محاسبه می شود و مراحل قبل تکرار می گردند. این فرآیند تا جایی تکرار می شود که میزان افزایش امتیاز در آن مرحله از کسر مشخصی از کل افزایش بدست آمده از ابتدای فرآیند کمتر شود. این فرآیند به طور دقیق در تصویر (3-5) ارائه شده است.
01
/> |
فرم در حال بارگذاری ...
[شنبه 1399-09-22] [ 05:29:00 ق.ظ ]
|