1-1- تعریف مسئله………………………… 2
1-2- چالشهای مسئله………………………. 4
1-3- نگاهی به فصول پایاننامه……………… 7
فصل دوم. مبانی نظری تحقیق
2-1- مقدمه…………………………….. 10
2-2- متدهای یادگیری تجمعی……………….. 11
2-2-1- تعاریف مفاهیم اولیه……………. 11
2-2-2- درخت بوستینگ………………….. 13
2-2-3- درخت بگینگ……………………. 13
2-3- رندوم فارست……………………….. 15
2-3-1- مراحل توسعهی رندوم فارست……….. 16
2-3-2- تئوریهای مرتبط با رندوم فارست…… 19
2-3-3- رندوم فارست برای رگرسیون……….. 22
2-3-4- مزایا و کاربردهای رندوم فارست…… 23
2-4- نتیجهگیری…………………………. 24
فصل سوم. پیشینه تحقیق
3-1- مقدمه…………………………….. 26
3-2- تعریف مسئله……………………….. 26
3-3- روشهای مبتنی بر آنالیزهای سری زمانی….. 29
3-4- روشهای مبتنی بر مدلهای شبکه عصبی…….. 32
3-5- روشهای مبتنی بر الگوریتمهای دادهکاوی…. 34
فصل چهارم. معرفی تکنیک پیشنهادی
4-1- مقدمه…………………………….. 40
4-2- خصوصیات کلی پایگاه داده…………….. 41
4-3- پایگاه دادهی مورد استفاده…………… 42
4-3-1- دادهی آموزشی………………….. 44
4-3-2- دادهی آزمایشی…………………. 44
4-4- تکنیک پیشنهادی…………………….. 45
4-4-1- بررسی توزیع جریانهای ترافیکی……. 47
4-4-2- مرحله پیش پردازش و استخراج ویژگی… 50
4-4-3- مرحله شناسایی و تقسیم بندی به Context های مختلف 52
4-4-4- مرحله یادگیری با بکارگیری Context-Aware Random Forest 56
فصل پنجم. نتایج تجربی
5-1- مقدمه…………………………….. 59
5-2- پایگاه داده……………………….. 60
5-3- معیارهای ارزیابی…………………… 61
5-3-1- معیار ارزیابی خطای پیشبینی……… 61
5-3-2- مقایسه کارآیی معیارهای سنجش فاصله بر روی مشاهدات ترافیکی 62
5-4- بررسی تناسب الگوریتم رندوم فارست در مقایسه با دیگر متدها 64
5-5- تنظیمات اعمال شده در پیاده سازی الگوریتم (تنظیم پارامترها) 66
5-6- ارزیابی سایز گردآمدگی بر روی دادهی اعتبارسنجی 67
5-7- استخراج مجموعههای نمونههای آموزشی……. 70
5-8- نتایج یادگیری الگوریتم بر روی مجموعههای نمونههای آموزشی 72
فصل ششم. نتیجهگیری
خلاصهی مطالب و نتیجه گیری………………… 75
فهرست منابع و مآخذ……………………… 78
فهرست جدولها
جدول شماره 4-1: شرح مفاهیم و معادل ترمهای مورد استفاده 45
جدول شماره 5-1: مقایسه میانگین خطای الکوریتمهای مختلف weka 64
جدول شماره 5-2: مقایسه خطای الگوریتم بگینگ و رندوم فارست 66
فهرست شکلها
شکل 1-1: معماری کلی مربوط به متدهای یادگیری تجمعی 6
شکل 2-1: معماری کلی الگوریتم بگینگ……….. 14
شکل 2-2: نمایی کلی از الگوریتم رندوم فارست.. 16
شکل 2-3: معماری کلی مربوط به الگوریتم رندوم فارست 20
شکل 4-1: صفحهی نمایش شبیه ساز ترافیک TSF…… 42
شکل 4-2: نقشهی شهر Warsaw، اعمال شده بهTSF….. 43
شکل 4-3: نمایش نمادین اعمال تکنیک پیشنهادی… 46
شکل 4-4: توزیع جریانهای ترافیکی مسیرها……. 47
شکل 4-5: ارائهی دید دقیقتر در خصوص رفتار جریانهای ترافیکی 48
شکل 4-6: نمایش نمادین روند انجام مرحله گردآمدگی 50
شکل 4-7: نمودار الزامات معیار شباهت مناسب…. 53
شکل 4-8: جریانهای ترافیکی مسیرها مربوط به دو context 55
شکل 5-1: مثالی از چگونگی اعمال مراحل گردآمدگی 68
شکل 5-2: مقایسهی خطا روشها با اعمال سایزهای مختلف گردآمدگی 69
شکل 5-3: مراحل نمادین استخراج مجموعه نمونه آموزشی 71
شکل 5-4: مقایسه خطای تکنیک پیشنهادی و روش Ensemble RF
چکیده
امروزه موفقیت سیستمهای حملونقل هوشمند، نه تنها به اطلاعات وضعیت فعلی ترافیک، بلکه تا حد زیادی به آگاهی از وضعیت ترافیکی دقایق آینده وابسته است. از اینرو، تحقیقات زیادی در زمینه پیشبینی کوتاهمدت وضعیت ترافیکی انجام شده است. هرچند تاکید اکثریت آنها، تنها بر روی اعمال الگوریتمهای مختلف بمنظور یادگیری دادههای ترافیکی و ارائهی مدل، بر اساس دادههای جمعآوری شده از وضعیت فعلی و پیشین میباشد. حال آنکه، در جهت رسیدن به الگوریتمی کارا، لازم است تا ماهیت نوساناتی و وابسته به زمان دادهها نیز در روند یادگیری مدل لحاظ شود. در این راستا، این پایاننامه با مطالعهی توزیع جریانهای ترافیکی، سعی در جداسازی رفتارهای مربوط به پریودهای اوج و غیراوج ترافیکی و همچنین استفاده از مفاهیم و دانش بدستآمده برای آموزش مدلهای متمایز متناظر با رفتارهای مختلف ترافیکی دارد. شایان ذکر است که حتی در صورتیکه زمان مرتبط با دادهها صریحاً در اختیار نباشد، روش پیشنهادی با بررسی توزیع داده، روند جریانهای ترافیکی را تشخیص میدهد. بدین ترتیب، رندوم فارست بعنوان مدل پیشبینیکننده، از زمینه دادهی مورد آموزش باخبر بوده و بر این اساس احتمال گیراُفتادن آن در بهینهی محلی کمتر میشود. به منظور ارزیابی روش ارائه شده، آزمایشاتی بر روی دادهی بخش ترافیک مسابقه بینالمللی دادهکاوی سال 2010 انجام شد. نتایج حاصل، مؤید کارایی و مقیاسپذیری روش پیشنهادی در مقایسه با دیگر نتایج بدست آمده توسط تیمهای برتر مسابقه، میباشد.
مقدمه
1-1 تعریف مسئله
امروزه، با توجه به گسترش روزافزون مطالبات حملونقل و بروز مشکلات ناشی از افزایش ترافیک شهری، ازجمله آلودگی هوا، آلودگی صوتی، مصرف سوخت، اتلاف وقت و انرژی و هزینههای تحمیلی آنها، ارائه راهکار مناسب درجهت روان شدن ترافیک از اهمیت ویژهای برخوردار است. از طرفی باتوجه به محدودیتهای امکانات شهرسازی در مقابل تقاضای انبوه وسایل نقلیه، لازم است تا تمهیداتی کاربردی و امکانپذیر برای حل این معضل درنظر گرفته شود. ازآنجا که تاکنون فناوری اطلاعات[1] نقش مؤثری درعرصههای مختلف
صنعتی ایفا کرده است، ورود این تکنولوژی در زمینهی سیستمهای حملونقل نیز بعنوان راهکاری مناسب مورد توجه قرارگرفت و منجر به پدیدآمدن سیستمهای حملونقل هوشمند[1] شد. در