نوع مقاله : مقاله پژوهشی
نویسندگان
1 گروه مهندسی برق، دانشکده مهندسی، پردیس آزادی، دانشگاه یزد، یزد، ایران.
2 گروه مهندسی برق، دانشکده مهندسی، دانشگاه یزد، یزد، ایران.
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسندگان [English]
Background and Aims Today, with the industrialization of societies and the reduction of the size of households and tendency to live alone, caring for the elderly and monitoring their performance in daily life has become doubly important. Carrying devices such a GPS is one of the proposed solutions, which may not be a suitable solution due to the unpleasant feeling of carrying such equipment and due to disorders such as Alzheimer’s disease. A proper solution for taking care of old people especially for their outdoor activities is to observe their behavior by using their mobile GPS sensor by which it is possible to detect possible abnormal events. An important challenge in this method is the high number of abnormal events. In this paper, this problem is solved by applying an adaptive neuro-fuzzy inference system (ANFIS). Other important challenge is how to carefully analyze the training data to achieve a powerful model. For tackling this problem, we used a deep neural network.
Methods In this paper, by combination of ANFIS and convolutional neural networks (CNN), a method was proposed for anomaly detection in trajectory of patients with Alzheimer’s disease. The CNN was optimized by the Whale algorithm. The proposed method was applied on a set of movement path data with a specific origin and destination based on the mobile GPS sensor of subjects.
Results The proposed method had an accuracy of 95.5% for classification of test data, which indicated the effectiveness of the proposed method.
Conclusion It seems that the combination of ANFIS and a CNN is a good method for anomaly detection in trajectory of older people with Alzheimer’s disease.
کلیدواژهها [English]
Introduction
The industrialization of societies has had various consequences, one of which is the tendency or compulsion to live alone. This problem can be discussed from multiple perspectives. Older people, due to having conditions such as amnesia and Alzheimer’s disease or having psychological disorders, are not interested in carrying devices such as a global positioning system (GPS) which makes it to take care of them. A suitable solution for this problem is the use of a global positioning sensor in the mobile phone, which reduces the limitations and problems caused by carrying an additional device [1]. In this study, by integrating modern techniques of deep neural networks (DNNs) and adaptive neuro-fuzzy inference system (ANFIS), a novel approach is proposed that can be used for automatic monitoring of older people’s commute. An anomaly detection system is usually trained using a training data in such a way that the behaviors are first collected in a certain period of time. The collected data are then used to learn the normal behaviors. After that, when a new data is arrived, the learned system is used to decide whether the behaviors is normal or abnormal [2].
So far, many studies have been performed in this field. For example, one study proposed an anomaly detection system using the Faster-Region-based Convolutional Neural Network (RCNN) and Multiple Object Tracking (MOT) methods [10]. Their results showed that the abnormal routes from surveillance cameras can be well detected. The differences between this research and the current study are in the architecture of the adopted neural networks and the way that the routes are created. This route is used as the input of the neural networks. In our study, routes are created using the phone GPS data, while in above-mentioned study, routes were extracted from video sequences.
Materials and Methods
The main steps in proposing the method are input data preparation, data augmentation, optimization of convolutional neural network (CNN), and using ANFIS. These two networks are combined at decision level. Data augmentation is more important for training of the CNN where a large number of training data is required. GeoTracker software was used to extract the data related to the location sensor of a mobile. In this software, the location information is stored. The data can be downloaded and stored in the KML format in a cloud storage for further analysis. The information in the KML format can be transferred to QGIS software. By using this software, the traveled path is extracted and presented in the form of an image. A pre-processing step is then performed to convert it to a binary image. In this study, 72 separate routes were extracted from the mobile phone of older people. Of these, 70 % were used for training and the rest were used as the test data. The selection of data was done in an equally weighted and random manner. Finally, 22 normal routes and 8 abnormal routes were used as the test data. The used mobile phone was Samsung Galaxy S7 SM-G930FD, with Android 6.0.1 operating system. The GPS sensor of this device uses the GLONASS technology and record the position with a 30-cm accuracy. A data augmentation process was also applied to increase the number of training samples. For this purpose, several augmentation methods including rotation and transferring in several directions were used. A two-stream classification approach was used in this study containing CNN and ANFIS. In the CNN stream, as a 15-layer DNN, the network was configured to use a random initial learning rate (α), and momentum learning rule (μ) where the number of epochs was 50. A L2 regularization rate (R) and a membership withdrawal rate of 0.1 were used to increase the data from the rule. To increase the number of data, the rule of rotation and transfer in X and Y directions with a rotation rate of -10 to +10 degrees and a transfer rate of -4 to +4 pixels were used which increased the number of data up to 1280 (from 42 routes to 5370 routes). The values of initial learning rate, momentum, and L2 regularization were optimized in each iteration by using the Whale optimization algorithm with the initial population of 100. We compared this algorithm with two other methods: (a) The genetic algorithm (GA) with an initial population of 100, 10 iterations (generations) and a mutation rate of 1%, and (b) The particle swarm optimization (PSO) algorithm with an initial population of 100, a damping rate of 0.99, a personal acceleration coefficient of 2, and a collective acceleration coefficient of 2. The ANFIS network used in this work was based on the Takagi–Sugeno fuzzy inference system [13] which composed of a triangular function (RMSE=0.1514, R2=0.97), 10 rules, and two membership functions.
Results
By comparing the simulation results, it was found that the Whale optimization algorithm was better than the PSO and GA for optimizing the CNN parameters. Moreover, our results showed that the ANFIS algorithm had a good recognition ability for detecting abnormal routes, while the CNN had better performance in detecting complex patterns in normal routes. As a result, it is expected that the integration of these two systems can lead to an overall better performance. Our experimental results confirmed this hypothesis. The F-RCNN method proposed in Zhao et al.’s study [10] was also implemented. The experimental results demonstrated that this method had poorer performance compared to the proposed method. A 10-fold cross-validation method was also used, resulting in an average accuracy of 94.28% for 10 executions, which is consistent with the previous results. Overall, it can be said that the proposed method is able to discriminate abnormal and normal routes with a good accuracy.
Conclusions
In this study, a new method was proposed for detecting abnormalities in the GPS-based path data of patients with Alzheimer’s disease. This method which consists of two classification streams (an optimized CNN and an ANFIS) showed very good results. One of the advantages of this study was the use of Whale optimization algorithm for optimizing some of the hyper-parameters in the CNN. This optimization process led to an efficient structure with a 95.5% accuracy compared to a non-optimized network with 77.3% accuracy and Zhao et al.’s method with 81.8% accuracy.
Ethical Considerations
Compliance with ethical guidelines
In this study, there was no experiments on human or animal samples. Therefore, there were no ethical principles to be considered.
Funding
This study was extracted from the PhD thesis of the first author approved by the Department of Electrical Engineering, Yazd University.
Authors' contributions
The authors contributed equally to preparing this paper.
Conflict of interest
The authors declared no conflict of interest.
Acknowledgments
The authors would like to thank the Centre of Excellence on Soft Computing and Intelligent Information Processing of Ferdowsi University of Mashhad for their hardware support.
مقدمه
در سالهای اخیر با پیشرفت فناوری و گسترش و ارتقا بسترهای سختافزاری مناسب برای پردازشهای نرمافزاری، استفاده از فناوری و یاری جستن از آن در کاربردهای تشخیص هوشمند فراهم شده است. یکی از این موارد تشخیص هوشمند که میتواند تا حدود زیادی در پیشگیری از سوانح و رویدادهای بعضاً جبرانناپذیر مؤثر باشد، تحلیل و تشخیص ناهنجاری در مسیر حرکت افراد مسن است که بهطور ویژهای در سالهای اخیر موردتوجه پژوهشگران این حوزه قرار گرفته است.
صنعتی شدن جوامع، پیامدهای متفاوتی را در برداشته است که یکی از پیامدهای اجتماعی آن، تمایل یا اجبار به زندگی بهصورت انفرادی در افراد کهنسال است. این مشکل از جوانب متعددی میتواند موردبحث قرار گیرد که در این مقاله مشکلات نظارتی مربوط به رفتوآمد فرد کهنسال موردتوجه قرار گرفته است.
افراد کهنسال بعضاً باتوجهبه مواردی چون فراموشی و آلزایمر و یا بهدلیل مسائل روحی روانی، عموماً رغبتی به همراه داشتن دستگاهی اضافی مانند دستگاههای مبتنی بر موقعیتیابی جهانی نداشتند و این کار را برای افرادی که وظیفه مراقبت از آنها را به عهدهدارند، دشوار میکند. یک راهحل مناسب برای این مشکل، بهرهگیری از حسگر موقعیتیاب جهانی تعبیهشده در تلفن همراه فرد است که تا حدودی محدودیتها و مشکلات مطرحشده برای حمل دستگاه اضافی را کاهش میدهد [1]. در این پژوهش با بهرهگیری از تلفیق روشهایی نوین چون شبکههای عصبی عمیق و روشهایی کارآمد چون شبکههای فازی عصبی وفقی، فرایندی پیشنهاد شده است که بتوان با کمک آن در جهت نظارت خودکار بر عبور و مرور افراد کهنسال گامی مؤثر برداشت.
اساس کار در یک سیستم خودکار تشخیص ناهنجاری بر پایه آموزش سیستم از طریق دادههای آموزشی است. به این صورت که در ابتدا رفتارهای موردنظر در دوره زمانی مشخص جمعآوری و با استفاده از این دادههای آموزشی، الگوریتم موردنظر آموزش داده میشود تا پس از آن، با دریافت دادههای جدید بهعنوان ورودی و بررسی وضعیت آن، هنجار یا ناهنجار بودن رفتار کاربر موردنظر گزارش شود [2].
در این زمینه، مشکلاتی وجود دارد، ازجمله اینکه در فرایند آموزش چنین فرایندی، بهدلیل پیچیدگی موجود، دادههای آموزشی برچسبدار بسیار زیادی مورد نیاز خواهد بود. همچنین بهدلیل تنوع بالای ناهنجاریها، سیستم فراتر از فرایند آموزش با دادههای آموزشی، باید به یک فهم و درک از فرایند فوق دستیابد تا بتواند نمونههای نوین ناهنجاری را آشکار سازد. در این مقاله برای حل این مشکلات، استفاده از روشی پیشنهاد میشود که در آن علاوهبر آموزش سیستم با دادههای آموزشی، امکان اضافه کردن قوانین نزدیک به فهم و درک انسان تحت عنوان قوانین فازی ایجاد شده است. این کار با انتخاب خودکار تعداد مشخصی از قوانین و توابع عضویت از درون دادهها امکانپذیر شده است. باتوجهبه این نکته که استفاده از دادههای آموزشی بهتنهایی در یک سامانه تشخیص ناهنجاری، موجب میشود سیستم طراحیشده از انعطاف لازم برای مواجهه با رویدادهای جدیدی که تاکنون رخ نداده و تشخیص آن نیاز به درک و فهم سطح بالایی دارد، با دشواریهایی همراه باشد و خواستههای موردنظر را در کاربرد تعریفشده برآورده نکند. پیشبینی می شود بهرهگیری از فرایندهای منطبق بر منطق فازی که با ساختارهایی مشابه آنچه در شبکههای عصبی در جریان است بهینهشده باشد، بتواند مثمر ثمر واقع شود.
علاوهبر موضوع انعطاف، سیستم پیشنهادی باید از ویژگی دیگری نیز برخوردار باشد که بتواند عملکرد خوبی را تضمین کند و آن استفاده به بهترین نحو ممکن از دادههای آموزشی در قالب استخراج ویژگیهایی کارآمد است. برای این مورد نیز بهترین گزینه بهرهگیری از شبکههای عصبی عمیق است. ساختار این شبکهها بهگونهای است که علاوهبر امکان دستیابی به ویژگیهای مرتبه بالاتر با استفاده از دادههای آموزشی، امکان دستهبندی را نیز ممکن میکند. تاکنون شمار گستردهای از روشهای مبتنی بر شبکههای عصبی عمیق بهطور گسترده در کاربردهای مختلف ازقبیل فناوری اطلاعات زیستی [3]، بازشناسی گفتار [4]، دادهکاوی [5]، بازیابی اطلاعات و شناسایی الگو [6] مورداستفاده قرار گرفته است و این خود گویای این موضوع است که شبکههای عصبی عمیق ابزاری قوی برای کاربردهای مختلف میباشند.
رویکرد خاص دیگری که در این پژوهش مدنظر قرار گرفته است، بهینهسازی شبکه عصبی عمیق با بهرهگیری از الگوریتم بهینهسازی وال یا نهنگ با هدف بهینهسازی ابرپارامترهای این شبکه است که منجر به بهبود نتایج دستهبندی با بهرهگیری از ارائه ساختاری با ابر پارامترهای بهینهشده با داده ورودی خواهد شد.
ازجمله پژوهشهای صورتگرفته در زمینه تشخیص ناهنجاری با استفاده از دادههای مربوط به مسیر میتوان به پژوهش زونیک و همکاران [7] اشاره کرد که در آن استفاده از روشهای مرسوم یافتن پیک QRS در سیگنال ECG، برای تشخیص ناهنجاریها در مسیرهای ثبتشده توسط دستگاه GPS مستقر در خودرو موردتوجه قرار گرفته است. این ناهنجاریها که بعضاً بهدلیل بروز اختلال در عملکرد دستگاه بهصورت عمدی یا غیرعمدی رخ میدهد برای سازمانها و نیروهای هر سازمان، هزینههایی دربر دارد که پژوهش گفتهشده با یافتن این ناهنجاری در اطلاعات موقعیت ثبتشده درپی کاهش این خسارتها است. در پژوهش حاضر هدف نهایی دستیابی به دریافت دقیقی از نوع مسیر است و با این فرض صورت گرفته که دادههای ثبتشده از تلفن همراه کاملاً صحیح و بدون خطا ثبت شده است.
در پژوهش باروسیا و همکاران [8]، با استفاده از تحلیل اطلاعات مربوط به تلفن همراه رانندگان، فرایند تشخیص ناهنجاری با هدف ایجاد یک بستر امن برای رانندگی پیادهسازی شده است. در این پژوهش با تحلیل دادههای مربوط به مسیر وسایل نقلیه، فرایند تشخیص ناهنجاری صورت گرفته و ویژگیهای مختلف کاربر در بازه زمانی مشخص، ملاک رفتار هنجار یا ناهنجار قرار گرفته است. ویژگیهای مورداستفاده در این پژوهش شامل مسافت طیشده، متوسط سرعت، میانگین حسابی سرعت است و این ویژگیها بر روی مجموعه دادگانی متشکل از 6853 مسیر واقعی، پیادهسازی شده است. دستیابی به 98 درصد تشخیص صحیح بیانگر عملکرد خوب آن در فرایند تشخیص ناهنجاری است. تفاوت این پژوهش با فرایند صورتگرفته در مقاله حاضر، نوع ویژگیهایی است که برای آموزش شبکههای عصبی عمیق مورد بهرهبرداری واقع شده است.
در پژوهش دبیری و همکاران [9]، با بهرهگیری از اطلاعات حسگر GPS دستگاه تلفن همراه فرد و همچنین شبکه عصبی عمیق کانولوشنی به تشخیص نوع وسیله نقلیه مورداستفاده توسط فرد برای رفتوآمد پرداخته شده است. برای این منظور، ورودیها بهصورت دنبالههای زمانی متشکل از اطلاعات سرعت، شتاب، حرکتهای ناگهانی و نرخ تحمل در نظر گرفته شده است که به یک شبکه عصبی عمیق کانولوشنی برای دستهبندی وارد میشوند. کلاسهای موردنظر در این پژوهش شامل پیادهروی، دوچرخهسواری، اتوبوس، رانندگی با خودرو شخصی و قطار است. در پژوهش حاضر، علاوهبر شبکه عصبی عمیق کانالوشنال از طبقهبندهای دیگری چون KNN ،SVM ،DT ،RF و MLP جهت مقایسه نتایج بهره گرفته شده است. دستیابی به درصد صحت 84/8 درصد که بالاترین میزان را در میان کلیه طبقهبندهای فوق از آن خود کرده است، بیانگر عملکرد بسیار خوب شبکههای عصبی عمیق کانولوشنی نسبت به سایر روشهای مرسوم طبقهبندی است. در پژوهش دبیری و همکاران [9]، از دادههای GPS موبایل در چارچوب مسئله طبقهبندی دادهها استفاده شده است؛ درحالیکه در این مقاله، تشخیص هنجار یا ناهنجار بودن یک عمل با استفاده از چنین دادههایی مطرح است.
در مقاله شاین و همکاران [10]، روشی برای تشخیص ناهنجاری با بهرهگیری از روشهایی چون Faster-RCNN وMOT پیشنهاد شده است و درنهایت اطلاعات بهدستآمده از این ابزارها برای تعیین احتمال ناهنجاریها و تشخیص آنها ترکیب میشود. این مقاله باتوجهبه این نکته که دادههای ناهنجار از تنوع بسیار بالایی برخوردارند، فرایند تشخیص ناهنجاری را بهصورت بدون مربی پیشنهاد کرده است. دادههای مورداستفاده در این پژوهش شامل مجموعه دادگانی است که در سال 2019 برای تشخیص مسیرهای ناهنجار شهری از روی دوربینهای نظارتی طرحریزی شده است. تفاوت این پژوهش با مقاله پیشرو در نحوه ایجاد مسیرهای موجود بهعنوان ورودی شبکههای عصبی عمیق و همچنین نوع شبکه عصبی عمیق مورداستفاده است. در پژوهش حاضر مسیرها از روی دادههای GPS تلفن همراه ایجاد میشود، درحالیکه در این پژوهش مسیرها از دنبالههای ویدیویی استخراج میشود. علاوهبر آن در مقاله پیشرو از شبکه عصبی عمیق کانولوشنی با مشخصات مخصوص به خود بهره گرفته شد، درحالیکه در این مقاله از ساختارهایی استفاده شده که بهصورت مشخص پیش از این ارائه شده است.
در پژوهش دویس و همکاران [11] نیز یک مدل تشخیص ناهنجاری برپایه شبکههای عصبی عمیق با بهرهگیری از دادههای زمانی مربوط به شبکه حمل و نقل ارائه شده است. در پژوهش مورد اشاره، از شبکههای مرسوم حافظه طولانی-کوتاه مدت بهبودیافته با کمک یک تابع برازش برگرفتهشده از تحلیل مقدار حدی در فرایند تشخیص ناهنجاری استفاده شده است. روش پیشنهادی در مقاله یادشده، 7 مجموعه داده متنوع را که برگرفته از دادههای واقعی مانند تاکسیهای شهر نیویورک یا مسیر تاکسیهای شهر بنگلور هند است و در حوزه تشخیص ناهنجاری شناخته شده است، مورد ارزیابی قرار داده است. تفاوت پژوهش گفتهشده با روش پیشنهادشده در این مقاله، این است که در آن پژوهش، از اطلاعات حوزه زمان در قالب شبکههای حافظهدار طولانی-کوتاه مدت بهرهبرداری شده است. حال آنکه در این پژوهش، کل اطلاعات مسیر حرکت در قالب یک تصویر به شبکه کانولوشنی داده میشود و از ترکیب یک شبکه فازی با شبکه کانولوشنی بهرهبرداری میشود.
در ادامه این مقاله، ابتدا در بخش دوم مبانی مورداستفاده برای روش پیشنهادی ارائه میشود. سپس در بخش سوم روش پیشنهادی در قالب سه بخش استخراج داده، آموزش سیستم و ارزیابی سیستم مورد بررسی قرار خواهد گرفت. در بخش چهارم آزمایشهای انجامشده همراه با نتایج حاصله ارائه خواهد شد. درنهایت قسمت انتهایی نیز به جمعبندی و نتیجهگیری از پژوهش صورتگرفته اختصاص دارد.
مواد و روشها
بهمنظور ایجاد بستری مناسب برای مطرح کردن روش پیشنهادی، این بخش به ارائه ابزارهایی اختصاص دارد که در روش پیشنهادی مورداستفاده قرار گرفته است. اولین ابزاری که در این بخش مورد بررسی قرار میگیرد، شبکه عصبی عمیق کانولوشنی است.
شبکه عصبی عمیق کانولوشنی
شبکههای عصبی عمیق کانولوشنی یکی از پرکاربردترین ساختارهایی هستند که در پژوهشهای نوین حوزه بازشناسی الگو و بینایی ماشین مورداستفاده قرار میگیرند.
در این شبکهها لایههای متنوعی تعریف شده است که با استفاده از اصول و قواعدی منسجم، عملکردی مشخص دارند. بهطورکلی، یک شبکه کانولوشنی از سه لایه اساسی، شامل لایه کانولوشن, لایه پولینگ و لایه تماماً متصل تشکیل شده است. هرکدام از لایههای یادشده، وظیفهای مشخص را به عهده دارند.
برای این دسته از شبکههای عصبی فرایند آموزش شامل دو مرحله اصلی است. ابتدا مرحله جلوسو و سپس مرحله پس انتشار خطا. در مرحله جلوسو، ورودی به لایه ابتدایی شبکه وارد میشود و فرایند ضرب نقطهای بین ورودی و مؤلفههای هر نورون و نهایتاً فرایند کانولوشن در هر لایه صورت میگیرد. درنهایت خروجی شبکه محاسبه میشود. در اینجا بهمنظور تنظیم پارامترهای شبکه و یا بهعبارت دیگر فرایند آموزش، از نتیجه خروجی بهدستآمده برای اندازهگیری خطای شبکه استفاده میشود. برای این منظور، خروجی شبکه را با استفاده از یک تابع خطا با پاسخ صحیح مقایسه میشود و بدینصورت میزان خطا مورد محاسبه قرار میگیرد.
در مرحله بعدی، براساس خطای محاسبهشده، مرحله پس انتشار خطا آغاز میشود. در این مرحله با لحاظ کردن الگوریتمهایی مانند گرادیان نزولی، مشتق تابع خطا نسبت به هر پارامتر باتوجهبه قانون زنجیرهای محاسبه و تمامی پارامترها باتوجهبه تأثیری که بر خطای ایجادشده در شبکه دارند، تغییر پیدا میکنند. بعد از بهروزرسانی پارامترها مرحله جلوسو و پس از آن مرحله پس انتشار تکرار میشود و نهایتاً بعد از تکرار تعداد مناسبی از این مراحل، آموزش شبکه به اتمام میرسد. در این فرایند، ابرپارامترهایی ازقبیل نرخ آموزش، نرخ مومنتوم در فرایند گرادیان نزولی، نرخ متعادلسازی و غیره تعریف میشوند که تغییر در آنها میتواند با تغییر در نرخ نهایی طبقهبندی همراه باشد.
در مرحله آزمایش نیز پس از وارد کردن داده تحت آزمایش به ورودی شبکه عصبی از پیش آموزشدیدهشده در خروجی لایه انتهایی که لایه تماماً متصل است، میزان تعلق هر داده به کلاسهای مختلف مشخص میشود.
در این پژوهش، برای بهبود عملکرد شبکه عصبی عمیق، بهینهسازی 3 ابرپارامتر نرخ آموزش، نرخ مومنتوم در فرایند گرادیان نزولی و نرخ متعادلسازی بهره موردتوجه قرار گرفته است که در ادامه بررسی میشود.
نرخ آموزش و مومنتوم
استفاده از الگوریتم مومنتوم در چارچوب گرادیان نزولی تصادفی یکی از بهترین و شناختهشدهترین شیوههای مورداستفاده برای بهروزرسانی وزنها در شبکههای عصبی به شمار میرود. در این روش ماتریس وزن شبکه، W، با ترکیب خطی منفی گرادیانت تابع هزینه یعنی -∇ L(W) و مقدار تغییرات وزن در مرحله قبل Vt بهروزرسانی میشود (فرمول شماره 1):
در این رابطه، α نرخ یادگیری نامیده میشود که تأثیر مقدار گرادیانت در فرآیند بهروزرسانی را تعیین میکند و μ مقدار مومنتوم است که وزن آپدیت قبلی را تعیین میکند.
بهطورکلی بهمنظور محاسبه مقدار جدید تغییرات بردار پارامترها، Vt+1 و بنابراین محاسبه ماتریس Wt+1 در تکرار t+1 با داشتن مقدار بهروزرسانی قبلی Vt و ماتریس وزن فعلی Wt از عبارت فوق استفاده میشود:
یکی از چالشهای مهم برای به دست آوردن بهترین نتایج، مشخص کردن ابرپارامترهای α و μ است که کمی تغییر میتواند جواب نهایی را دستخوش تغییرات زیادی کند.
بهره نرخ متعادلسازی
معمولاً در فرایندهای یادگیری عمیق هدف کلی کمینه کردن تابع هزینهای است که در فرمول شماره 2 قابل مشاهده است:
در عبارت فوق، L میتواند هر تابع هزینهای ازجمله خطای دستهبندی در نظر گرفته شود. برای بهبود نتایج دستهبندی متعادلسازی بهعنوان ابزاری کارآمد پیشنهاد میشود و پارامتری بهمنظور تنظیم وزنها اضافه میشود و فرمول شماره 3 حاصل خواهد شد:
در فرمول شماره 3، λ پارامتر تنظیم است و F بهعنوان پارامتر نرمال فروبینیوس شناخته میشود و درواقع برابر با مجذور نرمال یک ماتریس خواهد بود. تعیین مقدار مناسب λ نیز از مسائل مهمی است که باید مدنظر قرار گیرد. این پارامتر وابسته به شرایط میتواند تنظیم شود؛ یعنی مقدار بالای وزنها با در نظر گرفتن یک مقدار کم برای λ قابلکنترل خواهد بود و بهطور مشابه مقدار زیاد برای λ بهمنظور تنظیم تأثیر بیشتر وزنها در نظر گرفته میشود. ازآنجاییکه تابع هزینه باید حداقلسازی شود، تناسب مطرحشده منطقی به نظر میرسد و با اضافه کردن مجذور نرم ماتریس وزنها و ضرب آن در پارامتر نظمدهی، وزنها تنظیم میشوند و تابع هزینه کاهش مییابد.
در این مقاله، یکی از بهترین الگوریتمهای تکاملی مورداستفاده قرار میگیرد، تا با کمک آن مقدار بهینه برای این 3 ابرپارامتر پیدا شود. الگوریتم در نظر گرفتهشده، الگوریتم وال نامیده میشود که در ادامه مورد بررسی قرار خواهد گرفت.
الگوریتم وال
در این بخش به معرفی الگوریتم فرا ابتکاری وال پرداخته میشود که میرجلیلی و همکاران در سال 2016 (1394) ارائه کردهاند [12]. نهنگها که یکی از بزرگترین موجودات عالم هستند، با نژادهای متفاوتی در سراسر گیتی حضور دارند. یکی از بزرگترین نژاد نهنگها، نهنگ گوژپشت است که ابعاد نهنگ گوژپشت حدود اندازه یک اتوبوس یا حتی بیشتر از آن است. نکته جالب در مورد این دسته از نهنگها، روش شکار کردن آنها است. این رفتار تحت عنوان روش تغذیه حباب تور نامگذاری شده است. اولویت نهنگهای گوژپشت شکار کریلها و یا ماهیهای کوچکی است که بهصورت دستهای در مجاورت سطح آب شنا میکنند. برای این منظور والها حبابهای شاخصی در امتداد یک دایره یا مسیرهایی مشخص ایجاد میکند و با این فرایند امکان تشخیص مکان شکار و محاصره ماهیها برای نهنگهای گوژپشت فراهم خواهد شد. بهدلیل اینکه مکان طراحی بهینه در فضای جستوجو از راه مقایسه تشخیص داده نمیشود، WOA فرض میکند که بهترین راهحل حاضر، شکار هدف است و بعد از اینکه بهترین عامل جستوجو شناسایی شد، سعی میشود عوامل دیگر جستوجو مکان خود را نسبت به بهترین عامل جستوجو، بهروزرسانی کنند. این رفتار از طریق فرمولهای 4، 5، 6 و 7 زیر بیان شده است [11]:
در فرمول شماره 4 و 5 منظور از «.» ضرب داخلی است. همچنین k معرف تکرار جاری بوده، و بردارهای ضرایب، بردار مکان بهترین راهحل بهدستآمده جاری و نهایتاً بردار مکان است. در صورت وجود راهحل بهتر، در هر تکرار باید بهروزرسانی شود. بردار و بهصورت فرمول شماره 6 و 7 محاسبه میشود [12]:
که بهصورت خطی از مقدار 2 تا صفر و در طی تکرارهای متوالی کم میشود (در هر 2 فاز اکتشاف و استخراج) و نیز بردار تصادفی در فاصله صفر تا 1 است. حاصل فرمول شماره 6 با محاسبه ضرب داخلی مورد محاسبه قرار میگیرد.
روش حمله حباب تور (فاز استخراج)
برای مدلسازی رفتار حباب تور، 2 روش زیر طراحیشده است که مورد بررسی قرار میگیرد:
مکانیسم محاصره انقباضی
این رفتار ازطریق افزایش مقدار در فرمول شماره 6 حاصل میشود. به یاد داشته باشید که محدوده نوسان بهوسیله کاهش مییابد. بهعبارت دیگر، مقداری تصادفی در فاصله تا - است و در طی تکرارها، از مقدار 2 تا صفر کاهش مییابد. با انتخاب مقادیر تصادفی در فاصله 1- تا 1، میتوان مکان جدید عامل جستوجو را در هرجایی بین مکان اصلی عامل و مکان بهترین عامل کنونی تعریف کرد.
مکان در حال بهروزرسانی مارپیچی
این روش در ابتدا فاصله بین نهنگ قرارگرفته در مختصات و طعمه موجود در و را محاسبه میکند. معادلهای مارپیچی بین موقعیت نهنگ و طعمه تشکیل شد تا حرکت حلزونی شکل نهنگ گوژپشت را تقلید کند (فرمول شماره 8):
فرمول فوق به فاصله اولین نهنگ تا طعمه اشاره دارد (بهترین راهحل بهدستآمده تا اینجا)، ثابتی برای تعریف شکل مارپیچ لگاریتمی است و عددی تصادفی بین 1- تا 1 است. نهنگ گوژپشت، حول طعمه در امتداد یک دایره انقباضی و همزمان در مسیر مارپیچی شکلی شنا میکند. برای مدلسازی این رفتار همزمان، فرض شده است که نهنگ با احتمال 50 درصد از بین مکانیسم محاصره انقباضی و یا مدل مارپیچی یکی را انتخاب میکند تا موقعیت نهنگها در طول بهینهسازی بهروزرسانی شود. مدل ریاضی بدینصورت است (فرمول شماره 9):
در این فرمول عددی تصادفی بین صفر تا 1 است. علاوهبر روش حباب تور، نهنگهای گوژپشت بهصورت تصادفی به دنبال طعمه میگردند. مدل ریاضی جستوجو بدینصورت است:
جستوجوی برای طعمه (فاز اکتشاف)
روشی مشابه بر مبنای واریانس بردار را میتوان جهت جستوجوی شکار (اکتشاف) به کار گرفت. درحقیقت، نهنگهای گوژپشت، برطبق مکان یکدیگر، بهصورت تصادفی به جستوجو میپردازند. بنابراین، بردار را با مقادیر تصادفی بزرگتر از 1 و یا کمتر از 1- بهکار گرفته شد تا عامل جستوجو را مجبور به دور شدن از نهنگ مرجع کند. برخلاف فاز استخراج، برای بهروزرسانی موقعیت عامل جستوجو در فاز اکتشاف بهجای استفاده از دادههای بهترین عامل جستوجو، از انتخاب تصادفی عامل بهره برده شده است. این مکانیسم به همراه بر اکتشاف تأکید دارند و به WOA اجازه میدهند تا جستوجویی سراسری را انجام دهند. مدل ریاضی در فرمول شماره 10 قابل مشاهده است:
در فرمول شماره 11، بردار موقعیت تصادفی انتخابشده (نهنگ تصادفی) از جمعیت جاری است. الگوریتم WOA با مجموعهای از راهحلهای تصادفی شروع به کار میکند. در هر تکرار، عوامل جستوجو، موقعیت خود را باتوجهبه عامل جستوجویی که تصادفی انتخاب شدند و با بهترین راهحل بهدستآمده جاری، بهروزرسانی میکنند. مؤلفه برای فراهم آوردن اکتشاف و استخراج، بهترتیب از مقدار 2 تا صفر کاهش مییابد. یک عامل جستوجوی تصادفی در حالت انتخاب میشود، این در حالی است که بهترین راهحل زمانی انتخاب میشود که جهت بهروزرسانی موقعیت عوامل جستوجو، باشد. بسته به مقدار ، وال این قابلیت را دارد تا بین حرکت دایروی و یا مارپیچی، یکی را انتخاب کند. درنهایت، الگوریتم وال با ارضای شرایط خاتمه، پایان میگیرد. شبهکد مربوط به الگوریتم فوق در تصویر شماره 1 ارائه شده است [12].
در انتها باید خاطرنشان کرد خروجی بهدستآمده در این شبهکد، عبارت است از مقدار بهینه 3 ابرپارامتر که درنهایت در شبکه عصبی عمیق نهایی پیشنهادی این پژوهش مورداستفاده قرار خواهد گرفت.
یافتهها
روش پیشنهادی
در این بخش، روش پیشنهادی که شامل قسمتهای اساسی استخراج دادههای ورودی و ازدیاد آن (داده افزایی)، شبکه عصبی عمیق کانولوشنی بهبودیافته و شبکه عصبی فازی تطبیقی است، بهتفصیل بررسی میشود. در تصویر شماره 2، این بخشهای اساسی قابلملاحظه است.
همانطورکه در تصویر شماره 2 قابلمشاهده است، اولین بخش مربوط به مجموعه دادهها است که در ادامه مورد بررسی قرار میگیرد. تلفیق 2 طبقهبند موردنظر در سطح تصمیم است و مدل نهایی ساختاری دراد که از مزیتهای هر 2 طبقهبند بهره میگیرد. در توضیح بیشتر این شکل میتوان به این نکته اشاره کرد که برای آموزش بهتر شبکه عصبی عمیق باتوجهبه ضروری بودن تعداد بالای داده آموزشی استفاده از فرایند ازدیاد داده بسیار حائز اهمیت است، درحالیکه برای سیستم تطبیقی استنتاج عصبی فازی این نیاز کمتر محسوس است. نکته دیگر در این شکل، تلفیق 2 طبقهبند در دستیابی به مدلی است که میتوان از آن برای دستهبندی نهایی استفاده کرد. این مدل از 2 طبقهبند آموزشدیده تشکیل شده است که نتایج پیادهسازی آن بر روی دادههای جدید با ادغام در سطح تصمیم به دست میآید.
استخراج دادههای ورودی
برای استخراج مجموعه دادگان مربوط به حسگر تلفن همراه از نرمافزار GeoTracker استفاده میشود. در تصویر شماره 3 شمای کلی از نرمافزار موردنظر قابلمشاهده است.
در این نرمافزار اطلاعات مربوط به حسگر موقعیت تلفن همراه در مدتزمانی که فرد موردنظر از منزل خارج میشود، ذخیره میشود و در صورت اتصال به اینترنت در فضای ابری قابل بارگذاری و استفاده خواهد بود. این ذخیرهسازی با فرمت KML صورت میگیرد. گام دوم انتقال اطلاعات با فرمت KML به نرمافزار QGIS است. با بهرهگیری از این نرمافزار مسیر موردنظر استخراج میشود و در قالب یک تصویر در اختیار قرار میگیرد. روش پیشنهادی برای استخراج داده بهصورت گرافیکی در تصویر شماره 4 ارائه شده است.
در این تصویر برای نمایش بهتر مسیر از نرمافزار گوگل ارث بهره گرفته شده است. قبل از استفاده از مسیرها، فرایند پیشپردازش روی آن صورت میگیرد تا تصویر نهایی بهصورت باینری آماده استفاده شود. مبدا و مقصد انتخابشده شامل منزل تا نزدیکترین مرکز درمانی به آن است که فرد سالمند جهت دریافت خدمات درمانی دورهای به آنجا مراجعه میکند. دادههای ثبتشده که در قالب 72 مسیر مجزا ذخیرهشده است، دربرگیرنده جزئیات مسیر ثبتشده توسط حسگر موقعیتیاب تلفن همراه فرد سالمند طی ارتباط برخط با ماهوارههای GPS بوده و بهصورت آنی ذخیره شده است. دستگاه تلفن همراه مورداستفاده از برند سامسونگ مدل Galaxy S7 SM-G930FD بوده که به سیستمعامل اندروید نسخه 6،0،1 مجهز است. حسگر موقعیتیاب این دستگاه دارای فناوری GLONASS است و با دقت 30 سانتیمتر به ثبت موقعیت میپردازد.
پس از فراهم کردن مجموعه دادهها برای ایجاد بستری مناسب در جهت آموزش بهتر شبکه عصبی عمیق، از فرایند ازدیاد داده بهره گرفته شده است. برای این منظور از شیوههای متعددی چون چرخش و انتقال در راستای عرض و انتقال در راستای طول استفاده شده است. درنتیجه پس از فراهم کردن دادههای مورد نیاز، گام بعد به آموزش طبقهبندی اختصاص خواهد یافت.
آموزش طبقهبند
همانطورکه در مقدمه بیان شد یکی از مهمترین نوآوریهای این پژوهش، بهرهگیری از تلفیق 2 طبقهبند است. طبقهبند شبکه عصبی عمیق بهبودیافته برای دستیابی به مدلی مناسب از دادههای ورودی و طبقهبند مبتنی بر شبکه عصبی فازی برای دستیابی به انعطاف لازم در مواجهه با دادههای ناهنجار جدید. در ابتدا شبکه عصبی عمیق کانولوشنی مورداستفاده همراه با فرایند موردنظر برای بهینهسازی آن مطرح و سپس طبقهبند بر پایه شبکه عصبی فازی بررسی میشود.
شبکه عصبی عمیق بهبودیافته
چنانچه در قسمتهای قبل عنوان شد، نرخ آموزش اولیه، مومنتوم و نرخ متعادلسازی L2، ابرپارامترهایی هستند که ضرورت دارد تحت فرایند بهینهسازی مقدار مناسب آنها با بهکارگیری فرایند بهینهسازی تعیین شود. در این بخش ساختاری که در آن این ابر پارامترها بهینهسازی میشوند، ارائه میشود. در تصویر شماره 5 بلوک دیاگرام مربوط به این ساختار قابلمشاهده است.
در فرایند بهینهسازی ابر پارامترها، ابتدا مقادیری تصادفی در محدودهای مشخص برای حالت اولیه ابر پارامترها تعیین می شود و با بهرهگیری از آنها شبکه عصبی کانولوشنی اولیه شکل میگیرد. در گام بعد با این مقادیر بر روی مجموعه دادگان اعتبارسنجی، شبکه فوق اجرا شد و باتوجهبه اینکه برچسب دادههای پیشگفت مشخص است، تابع هزینه محاسبه میشود. با بهرهگیری از الگوریتم بهینهسازی وال و بهبود مقادیر ابر پارامترها در هر تکرار توسط آن، پیشبینی میشود که شبکه عصبی کانولوشنی مورداستفاده برای دستهبندی نهایی، همواره به سمت ساختار مناسب و قابلاطمینانتری پیش رود.
طبقهبندی مبتنی بر سیستم تطبیقی استنتاج عصبی فازی
سیستم تطبیقی استنتاج عصبی فازی را میتوان یکی از کارآمدترین فرایندهای استنتاج فازی به شمار آورد که بهعلت بهرهگیری از قاعده و قانون، همانند فرایندهای فازی است و به این دلیل که بهصورت یک شبکه عصبی آموزش میبیند، شبکه عصبی است. بهبیانی دیگر میتوان گفت سیستم تطبیقی استنتاج عصبی فازی، یک شبکه قابل آموزش است که ازنظر عملکرد کاملاً مشابه فرایند استنتاج فازی است و از مزیتهای شبکه عصبی بهره میبرد. در اینجا مفروض است که x و y دو ورودی شبکه موردنظر و خروجی این شبکه نیز متغیر z است [13]. حال اگر قوانین بهصورت فرمول شماره 12 باشند :
و اگر برای غیرفازیساز از غیرفازیساز میانگین مراکز استفاده شود، درنهایت ساختار معادل سیستم تطبیقی استنتاج عصبی فازی بهصورت تصویر شماره 6 خواهد بود:
در ادامه به تشریح لایههای انتخابی در فرمولهای شماره 13، 14، 15، 16، 17، 18 و 19 پرداخته میشود.
لایه 1: در این لایه ورودیها از توابع عضویت عبور میکنند.
توابع عضویت هر تابع در اکثر موارد بهصورت توابع گوسی انتخاب میشود که بهصورت یک تابع زنگی شکل خواهد بود:
که مجموعه پارامترها هستند. پارامترهای این لایه به پارامترهای اولیه معروف هستند.
لایه 2: خروجی این لایه ضرب سیگنالهای ورودی است که درواقع معادل قسمت اگر قوانین هستند.
لایه 3: خروجی این لایه متعادلسازیشده لایه قبلی است:
لایه 4: خروجی این لایه نیز بهصورت زیر خواهد بود:
لایه 5: خروجی این لایه نیز خروجی کلی سیستم است:
مجموع ساختار تشریح شده در بالا شبکه سیستم تطبیقی استنتاج عصبی فازی مورداستفاده را شکل میدهد. باتوجهبه حاصل پژوهشهای صورتگرفته بر روی طبقهبندیهایی برمبنای این ساختار، میتوان درصد صحت بسیار خوبی را از آن متصور شد.
اعتبار سنجی
در پژوهشهای مرتبط با حوزه بینایی ماشین و بازشناسی الگو از معیارهای متفاوتی جهت اعتبارسنجی مدل و ارزیابی نتایج استفاده میشود، ازجمله این معیارها میتوان به صحت، حساسیت و قدرت تشخیص اشاره کرد که 3 مؤلفه مهم برای ارزیابی نتیجه یک دستهبندی دوحالته یا دودویی هستند. زمانی که بتوان دادهها را به 2 گروه تقسیم کرد، دقت نتایج یک آزمایش که اطلاعات را به این 2 دسته تقسیم میکند، با استفاده از این 3 شاخص قابل اندازهگیری و توصیف است. حساسیت بیانگر نسبتی از موارد مثبت است که آزمایش، آنها را بهدرستی بهعنوان مثبت علامتگذاری میکند. قدرت تشخیص به معنا و مفهوم نسبتی از موارد منفی است که آزمایش، آنها را بهدرستی بهعنوان منفی علامتگذاری میکند. میزان صحت نیز عملکرد طبقهبند را روی هر 2 دسته بهطور همزمان مورد سنجش قرار میدهد.
بهطورکلی برای محاسبه معیارهای صحت، قدرت تشخیص و حساسیت، ابتدا چهار مؤلفه زیر باید مورد محاسبه قرار گیرند::
مثبت صحیح: داده ناهنجار، بهدرستی ناهنجار تشخیص داده شود.
مثبت کاذب: داده هنجار، به اشتباه ناهنجار تشخیص داده شود.
منفی صحیح: داده هنجار، بهدرستی هنجار تشخیص داده شود.
منفی کاذب: داده ناهنجار، به اشتباه هنجار تشخیص داده شود.
به بیان ریاضی، حساسیت حاصل تقسیم موارد مثبت واقعی به حاصل جمع موارد مثبت واقعی و موارد منفی کاذب است (فرمول شماره 20).
منظور از TP مثبت صحیح و FN منفی کاذب است.
به همین ترتیب، قدرت تشخیص حاصل تقسیم موارد منفی واقعی به حاصل جمع موارد منفی واقعی و مثبت کاذب است (فرمول شماره 21).
منظور از TN منفی صحیح و FP مثبت کاذب است.
مؤلفه صحت، متداولترین، اساسیترین و سادهترین معیار اندازهگیری کیفیت یک دستهبند است و عبارت است از میزان تشخیص صحیح دستهبند در مجموع 2 دسته. این کمیت درواقع نشانگر میزان الگوهایی است که درست تشخیص داده شدهاند و براساس ماتریس درهم-ریختگی، به شکل فرمول شماره 22 تعریف میشود.
ابزار دیگری که میتوان در جهت ارزیابی استفاده کرد، ابزار ماتریس درهمریختگی است که بهصورت بصری تمام مؤلفههای فوق را دربر میگیرد. در تصویر شماره 7 این اطلاعات قابلملاحظه است.
پس از بررسی جزئیات روش پیشنهادی و معیارهای ارزیابی، به شبیهسازی و یافتن نتایج خروجی پرداخته میشود تا درنهایت بتوان شیوه پیشنهادی را تحلیل کرد.
آزمایشها و نتایج شبیهسازی
پس از مطرح کردن جزئیات، قواعد و اصول روش پیشنهادی در این قسمت، شبیهسازی آن بررسی شده است و نتایج حاصل از آن هم بررسی میشود.
معرفی پایگاه داده
یکی از مهمترین بخشهای پیادهسازی هر روش، ماشین بینایی و بازشناسی الگویی بهرهگیری از پایگاه دادهای است که قابلیت بالایی از خود در ارزیابی مناسب از روش پیشنهادی ارائه دهد. برای این پژوهش از مجموعه دادگانی متشکل از 46 مسیر نرمال و 26 مسیر ناهنجار که در تصویر شماره 8 قابلمشاهده میباشند، استفاده شده است.
در شکل فوق، مسیرهای هنجار در سمت چپ بالا و پایین و با رنگ قرمز و مسیرهای ناهنجار در قسمت راست بالا و پایین و با رنگ سبز قابل مشاهده است. مسیرهای هنجار مسیرهایی هستند که در دسته مسیرهای عادی فرد، از مبدأ منزل به مقصد مرکز درمانی موردنظر قرار میگیرند و مسیرهای ناهنجار مواردی هستند که با طی مسیری غیرعادی بین این دونقطه برقرار میشوند. از میان 72 مسیر فوق، 70 درصد برای آموزش سیستم و 30 درصد برای آزمودن آن مورداستفاده قرار گرفته است. انتخاب دادهها بهصورت هموزن و تصادفی انجامشده که درنهایت 22 مسیر هنجار و 8 مسیر ناهنجار را در زمره دادههای آزمون قرار میدهد.
تنظیمات شبکه عصبی کانولوشنی
برای شبیهسازی روش پیشنهادی از یک شبکه عصبی عمیق با لایههای زیر استفاده شده است که در ادامه به تشریح آن پرداخته میشود.
لایه ورودی با ابعاد (1، 32، 32) مطابق ورودی است که البته تمام تصاویر مربوط به دادهها به این ابعاد تغییر سایز پیدا میکنند تا یکسانسازی صورت گیرد.
1. لایه کانولوشنی ابعاد فیلترها (3،3)، اندازه گام1؛
2. لایه متعادلسازی دستهای؛
3. لایه رلو؛
4. جمعبندی بیشینه؛
5. لایه کانولوشنی ابعاد فیلترها (3،3)، اندازه گام1؛
6. لایه متعادلسازی دستهای؛
7. لایه رلو؛
8. جمعبندی بیشینه؛
9. لایه کانولوشنی ابعاد فیلترها (3، 3)، اندازه گام1؛
10. لایه متعادلسازی دستهای؛
11. لایه رلو؛
12. لایه جمعبندی میانگین؛
13. لایه تماماً متصل؛
14. لایه سافتمکس؛
15. لایه طبقهبندی خروجی.
تنظیمات آموزش شبکه نیز به این صورت در نظر گرفته شده است که نرخ آموزش اولیه α و قاعده یادگیری بر مبنای گرادیان نزولی با مومنتوم μ و تعداد تکرارها 50 و نرخ متعادلسازی R، نرخ کنارهگیری از عضویت 0/1 مورداستفاده قرار گرفته برای ازدیاد دادهها نیز از قاعده چرخش و انتقال در جهت x و y با نرخ چرخش منفی 10 تا مثبت 10 درجه و نرخ انتقال منفی 4 تا مثبت 4پیکسل بهره گرفته شده است. تعداد دادهها را تا 1280 برابر افزایش میدهد، بهعبارتدیگر تعداد مسیرهای آموزشی از 42 مسیر به 53760 مسیر ارتقا پیدا میکند. مقادیر نرخ آموزش اولیه، مومنتوم و نرخ متعادلسازی L2 در هر تکرار تحت بهینهسازی قرار میگیرد تا نهایتاً به بهینهترین مقدار خود دست پیدا کند.
تنظیمات شبکه سیستم تطبیقی استنتاج عصبی فازی
شبکه سیستم تطبیقی استنتاج عصبی فازی مورداستفاده در این پژوهش از نوع سوگنو [13] و تابع مثلثی با E=0/1514 و R2=0/97 که در آن تعداد قوانین 10 در نظر گرفته شده است. تعداد توابع عضویت مورداستفاده برابر 2 و تعداد تکرارها برابر 50 لحاظ شده است.
نتایج شبیهسازی
در این بخش نتایج حاصل از شبیهسازی مورد بررسی قرار میگیرد. قبل از آن باید خاطرنشان شد کلیه نتایج حاصل از شبیهسازی در رایانهای با مشخصات CORI9 GPU 1080TITAN GEFORCE 64GRAM واقع در مرکز محاسبات سنگین دانشگاه فردوسی مشهد پیادهسازی شده است. سیستمعامل مورداستفاده ویندوز 10 و کلیه محاسبات با با نرمافزار متلب انجام شده است. در ابتدا مقدار بهینه بهدستآمده برای مؤلفههای شبکه CNN را در جدول شماره 1 ملاحظه می شود.
برای به دست آوردن نتایج جدول شماره 1، 20 بار مقدار تصادفی برای مقدار اولیه ابرپارامترها در محدوده مشخص قابلتعریف، تعیین شد و میانگین و واریانس مقادیر نهایی بهدستآمده برای آنها پس از اجرای کد برای این 20 مرتبه در جدول شماره 1 گزارش شد. برای مقایسه بهتر روش پیشنهادی، بهجای الگوریتم وال از الگوریتم PSO و GA نیز برای بهینهسازی پارامترها بهره گرفته شد که درنهایت مقادیر نهایی برای این 3 حالت نیز در جدول شماره 1 قابلمشاهده است. برای این شبیهسازی از الگوریتم GA با اندازه جمعیت اولیه 100، تعداد دفعات تکرار الگوریتم (تعداد نسلها) 10 و نرخ جهش 1 درصد استفاده شده است. الگوریتم PSO با مشخصات ابعاد جمعیت اولیه 100، نرخ میرایی 0/99، ضریب شتاب شخصی2، ضریب شتاب جمعی2 و الگوریتم وال نیز با مشخصات جمعیت اولیه 100 مورداستفاده قرار گرفته است.
در این قسمت برای ارائه نتایج در گام نخست، ابتدا شبکه CNN بدون بهینهسازی مورداستفاده قرار گرفت که در تصویر 9-الف نتیجه حاصل مشاهده میشود.
در گام بعد شبکه سیستم تطبیقی استنتاج عصبی فازی مورداستفاده را به دادهها اعمال شدند. در تصویر 9-ب، نتایج حاصله نشان داده شده است. با مقایسه تصاویر 9-الف و 9-ب میتوان دریافت که عملکرد شبکه سیستم تطبیقی استنتاج عصبی فازی روی دادههای ناهنجار و شبکه CNN در تشخیص دادههای هنجار بهتر عمل میکند.
درمجموع روش سیستم تطبیقی استنتاج عصبی فازی روی تمام دادهها عملکرد بهتری دارد. در تصاویر شماره 9-الف، عملکرد شیکه کانولوشنی قبل از بهینهسازی ابرپارامترهای آن نشان داده شده است و در این پژوهش در نهایت از الگوریتم بهینهسازیشده CNN استفاده شد که متعاقباً توضیحات لازم ارائه میشود. این شکل تنها برای یک مقایسه اولیه مورداستفاده قرار گرفته است. باتوجهبه تفاوت عملکرد این 2 شبکه بر روی دادههای هنجار و دادههای ناهنجار،پیشبینی میشود تلفیق این 2 شبکه بتواند با نتایج خوبی همراه باشد، اما قبل از آن در ادامه به بهینهسازی شبکه CNN با الگوریتمهای متنوع بهینهسازی پرداخته میشود تا مناسبترین شبکه CNN را برای دستیابی به نتیجه بهتر با سیستم تطبیقی استنتاج عصبی فازی تلفیق شود.
تصاویرهای 9-ج، 9-د و 9-ه دربرگیرنده نتایج حاصل از طبقهبند مبتنی بر شبکه CNN میباشند که بهترتیب با استفاده از الگوریتمهای GA، PSO و وال ابرپارامترهای آن بهینهسازی شده است.
با ارزیابی نتایج حاصله در حالات مختلف بهینهسازی شبکه CNN و بدون بهینهسازی آن، میتوان دریافت که ایده مورداستفاده درزمینه بهینهسازی ابرپارامترها با کمک الگوریتمهای تکاملی مؤثر واقع شده است و بهبود چشمگیری در درصد صحت بهدستآمده حاصل شده است.
با مقایسه تصاویر 9-ج، 9-د , 9-ه میتوان دریافت که الگوریتم بهینهسازی وال نسبت به دو الگوریتم PSO و GA عملکرد بهتری از خود در بهینهسازی ابر پارامترهای CNN نشان داده که درنهایت به نتیجه بهتری منجر شده است.
با مقایسه نتایج حاصل از تصاویر 9-ب و 9-ه نیز میتوان ملاحظه کرد که همچنان استفاده از الگوریتم سیستم تطبیقی استنتاج عصبی فازی شناخت خوبی در تشخیص موارد ناهنجاری درپی داشته است، درحالیکه CNN در تشخیص الگوهای پیچیده در دادههای هنجار موفقتر عمل کرده است. درنتیجه پیشبینی میشود تلفیق این دو ابزار امکان تشخیص ناهنجاری را در کنار رویدادهای هنجار با دقت خوبی فراهم آورد. درنهایت با مشخص شدن عملکرد بهتر الگوریتم وال و بهرهگیری از آن در بهینهسازی ابرپارامترها و تلفیق آن با سیستم تطبیقی استنتاج عصبی فازی نتایج حاصل این حالت نهایی، در تصویر شماره 9-و قابلمشاهده است.
نتایج حاصل در تصویر شماره 9-و حاکی از صحت فرضیه در نظر گرفتهشده برای کارآمد بودن این حالت نهایی است. بااینحال برای ارزیابی کاملتر روش پیشنهادی روش F-RCNN که در پژوهش [10] پیشنهاد شده است نیز بر روی مجموعه دادگان پیادهسازی شده که حاصل اعمال آن و عملکردش روی مجموعه دادههای فوق بهصورت تصویر شماره 9-ز خواهد بود. همانطورکه در تصویر 9-ز مشهود است، این روش عملکرد ضعیفتری نسبت به روش پیشنهادی دارد.
برای ارزیابی بهتر روش پیشنهادی، علاوهبر فرایند فوق از روش ارزیابی متقابل 10 بخشی نیز استفاده شد. در این رویکرد، نخست کل دادهها به 10 بخش که در هر قسمت به تعدادی یکسان داده از هر کلاس وجود داشت، تقسیم شد. سپس از 9 بخش برای آموزش سیستم به کیفیتی که در بخش پیشین ارائه شد، استفاده و از 1 بخش برای آزمودن آن بهره گرفته شد. این فرایند تا زمانی که تمام دادهها در فرایند آموزش و آزمایش حضور داشته باشند، ادامه یافت. درصد صحت بهدستآمده از این رویکرد بهصورت میانگین برای 10 بار اجرا برابر با 94/28 درصد به دست آمد که با نتایج قبلی سازگار است.
با ارزیابی نتایج حاصل از تمامی شکلها و نتایج فوق میتوان دریافت که روش پیشنهادی امکان تشخیص ناهنجاری را در کنار رویدادهای هنجار با دقت خوبی درپی داشته است، بهعبارتدیگر میتواند نتایج حاصل از شبیهسازی صورتگرفته را سندی بر عملکرد خوب روش پیشنهادی و جوابگو بودن ایده پیشنهادی در فرایند تشخیص ناهنجاری دانست.
نتیجهگیری
در این مقاله، روشی نوین در جهت تشخیص ناهنجاری در مسیر ثبتشده توسط حسگر GPS تلفن همراه برای مراقبت از سالمندان ارائه شده است. روش پیشنهادی بر پایه بهرهگیری از 2طبقهبند شبکههای عصبی عمیق کانولوشنی بهینهسازیشده و شبکه سیستم تطبیقی استنتاج عصبی فازی استوار است.
یکی از نوآوریهای مطرحشده در این مقاله بهرهگیری از الگوریتم بهینهسازی وال برای دستیابی به ساختار مناسب شبکه عصبی کانولوشنی با تعیین بهترین مقدار برای ابرپارامترهای نرخ آموزش اولیه، نرخ مومنتوم و نرخ متعادلسازی مربوط به آن است.
در این مقاله نشان داده شد، درنهایت این فرایند بهینهسازی به یک ساختار کارآمد منتهی خواهد شد و دستیابی به صحت 95/5 درصد در قیاس با صحت 77/3 درصد روی دادههای آزمایشی برای حالت بدون بهینهسازی و صحت 81/8 درصد برای روش رقیب نیز خود گواهی بر عملکرد مطلوب روش است.
درنهایت در تشریح بیشتر یافتههای این پژوهش میتوان اظهار کرد که با ارزیابی نتایج حاصل از تمامی شکلها و نتایج فوق میتوان دریافت که روش پیشنهادی امکان تشخیص ناهنجاری را در کنار رویدادهای هنجار با دقت خوبی درپی داشته است. بهعبارتدیگر میتواند نتایج حاصل از شبیهسازی صورتگرفته را سندی بر عملکرد خوب روش پیشنهادی و جوابگو بودن ایده پیشنهادی در فرایند تشخیص ناهنجاری دانست.
ملاحظات اخلاقی
پیروی از اصول اخلاق پژوهش
در این مقاله هیچ نمونه انسانی و حیوانی ندارد و ملاحظات اخلاقی وجود نداشته است تا ضرورت رعایت در این تحقیق در نظر گرفته شود.
حامی مالی
این مقاله برگرفته از پایاننامه مجتبی بنیفخر با راهنمایی دکتر محمدتقی صادقی گروه برق دانشگاه یزد میباشد.
مشارکت نویسندگان
تمام نویسندگان در آمادهسازی این مقاله مشارکت داشتند..
تعارض منافع
بنابر اظهار نویسندگان، این مقاله تعارض منافع ندارد.
تشکر و قدردانی
از مرکز محاسبات نرم و پردازش هوشمند اطلاعات در دانشگاه فردوسی مشهد بهدلیل پشتیبانی سختافزاری از این تحقیق قدردانی میشود.
References