Proposing a Method for Anomaly Detection in Trajectory of Patients With Alzheimer’s Disease Using Mobile GPS Data and Combination of Deep Neural Network and Adaptive Neuro-fuzzy Inference System

Banifakhr, Mojtaba; Sadeghi, Mohammad Taghi

doi:10.32598/SJRM.12.2.5

Proposing a Method for Anomaly Detection in Trajectory of Patients With Alzheimer’s Disease Using Mobile GPS Data and Combination of Deep Neural Network and Adaptive Neuro-fuzzy Inference System

Document Type : Original article

Authors

¹ Department of Electrical Engineering, Faculty of Engineering, Azadi Campus, Yazd University, Yazd, Iran.

² Department of Electrical Engineering, Faculty of Engineering, Yazd University, Yazd, Iran.

10.32598/SJRM.12.2.5

Abstract

Background and Aims Today, with the industrialization of societies and the reduction of the size of households and tendency to live alone, caring for the elderly and monitoring their performance in daily life has become doubly important. Carrying devices such a GPS is one of the proposed solutions, which may not be a suitable solution due to the unpleasant feeling of carrying such equipment and due to disorders such as Alzheimer’s disease. A proper solution for taking care of old people especially for their outdoor activities is to observe their behavior by using their mobile GPS sensor by which it is possible to detect possible abnormal events. An important challenge in this method is the high number of abnormal events. In this paper, this problem is solved by applying an adaptive neuro-fuzzy inference system (ANFIS). Other important challenge is how to carefully analyze the training data to achieve a powerful model. For tackling this problem, we used a deep neural network.
Methods In this paper, by combination of ANFIS and convolutional neural networks (CNN), a method was proposed for anomaly detection in trajectory of patients with Alzheimer’s disease. The CNN was optimized by the Whale algorithm. The proposed method was applied on a set of movement path data with a specific origin and destination based on the mobile GPS sensor of subjects.
Results The proposed method had an accuracy of 95.5% for classification of test data, which indicated the effectiveness of the proposed method.
Conclusion It seems that the combination of ANFIS and a CNN is a good method for anomaly detection in trajectory of older people with Alzheimer’s disease.

Keywords

Main Subjects

Geriatric Rehabilitation

Full Text

Introduction
The industrialization of societies has had various consequences, one of which is the tendency or compulsion to live alone. This problem can be discussed from multiple perspectives. Older people, due to having conditions such as amnesia and Alzheimer’s disease or having psychological disorders, are not interested in carrying devices such as a global positioning system (GPS) which makes it to take care of them. A suitable solution for this problem is the use of a global positioning sensor in the mobile phone, which reduces the limitations and problems caused by carrying an additional device [1]. In this study, by integrating modern techniques of deep neural networks (DNNs) and adaptive neuro-fuzzy inference system (ANFIS), a novel approach is proposed that can be used for automatic monitoring of older people’s commute. An anomaly detection system is usually trained using a training data in such a way that the behaviors are first collected in a certain period of time. The collected data are then used to learn the normal behaviors. After that, when a new data is arrived, the learned system is used to decide whether the behaviors is normal or abnormal [2].
So far, many studies have been performed in this field. For example, one study proposed an anomaly detection system using the Faster-Region-based Convolutional Neural Network (RCNN) and Multiple Object Tracking (MOT) methods [10]. Their results showed that the abnormal routes from surveillance cameras can be well detected. The differences between this research and the current study are in the architecture of the adopted neural networks and the way that the routes are created. This route is used as the input of the neural networks. In our study, routes are created using the phone GPS data, while in above-mentioned study, routes were extracted from video sequences.

Materials and Methods
The main steps in proposing the method are input data preparation, data augmentation, optimization of convolutional neural network (CNN), and using ANFIS. These two networks are combined at decision level. Data augmentation is more important for training of the CNN where a large number of training data is required. GeoTracker software was used to extract the data related to the location sensor of a mobile. In this software, the location information is stored. The data can be downloaded and stored in the KML format in a cloud storage for further analysis. The information in the KML format can be transferred to QGIS software. By using this software, the traveled path is extracted and presented in the form of an image. A pre-processing step is then performed to convert it to a binary image. In this study, 72 separate routes were extracted from the mobile phone of older people. Of these, 70 % were used for training and the rest were used as the test data. The selection of data was done in an equally weighted and random manner. Finally, 22 normal routes and 8 abnormal routes were used as the test data. The used mobile phone was Samsung Galaxy S7 SM-G930FD, with Android 6.0.1 operating system. The GPS sensor of this device uses the GLONASS technology and record the position with a 30-cm accuracy. A data augmentation process was also applied to increase the number of training samples. For this purpose, several augmentation methods including rotation and transferring in several directions were used. A two-stream classification approach was used in this study containing CNN and ANFIS. In the CNN stream, as a 15-layer DNN, the network was configured to use a random initial learning rate (α), and momentum learning rule (μ) where the number of epochs was 50. A L2 regularization rate (R) and a membership withdrawal rate of 0.1 were used to increase the data from the rule. To increase the number of data, the rule of rotation and transfer in X and Y directions with a rotation rate of -10 to +10 degrees and a transfer rate of -4 to +4 pixels were used which increased the number of data up to 1280 (from 42 routes to 5370 routes). The values of initial learning rate, momentum, and L2 regularization were optimized in each iteration by using the Whale optimization algorithm with the initial population of 100. We compared this algorithm with two other methods: (a) The genetic algorithm (GA) with an initial population of 100, 10 iterations (generations) and a mutation rate of 1%, and (b) The particle swarm optimization (PSO) algorithm with an initial population of 100, a damping rate of 0.99, a personal acceleration coefficient of 2, and a collective acceleration coefficient of 2. The ANFIS network used in this work was based on the Takagi–Sugeno fuzzy inference system [13] which composed of a triangular function (RMSE=0.1514, R2=0.97), 10 rules, and two membership functions.

Results
By comparing the simulation results, it was found that the Whale optimization algorithm was better than the PSO and GA for optimizing the CNN parameters. Moreover, our results showed that the ANFIS algorithm had a good recognition ability for detecting abnormal routes, while the CNN had better performance in detecting complex patterns in normal routes. As a result, it is expected that the integration of these two systems can lead to an overall better performance. Our experimental results confirmed this hypothesis. The F-RCNN method proposed in Zhao et al.’s study [10] was also implemented. The experimental results demonstrated that this method had poorer performance compared to the proposed method. A 10-fold cross-validation method was also used, resulting in an average accuracy of 94.28% for 10 executions, which is consistent with the previous results. Overall, it can be said that the proposed method is able to discriminate abnormal and normal routes with a good accuracy.

Conclusions
In this study, a new method was proposed for detecting abnormalities in the GPS-based path data of patients with Alzheimer’s disease. This method which consists of two classification streams (an optimized CNN and an ANFIS) showed very good results. One of the advantages of this study was the use of Whale optimization algorithm for optimizing some of the hyper-parameters in the CNN. This optimization process led to an efficient structure with a 95.5% accuracy compared to a non-optimized network with 77.3% accuracy and Zhao et al.’s method with 81.8% accuracy.

Ethical Considerations
Compliance with ethical guidelines
In this study, there was no experiments on human or animal samples. Therefore, there were no ethical principles to be considered.

Funding
This study was extracted from the PhD thesis of the first author approved by the Department of Electrical Engineering, Yazd University.

Authors' contributions
The authors contributed equally to preparing this paper.

Conflict of interest
The authors declared no conflict of interest.

Acknowledgments
The authors would like to thank the Centre of Excellence on Soft Computing and Intelligent Information Processing of Ferdowsi University of Mashhad for their hardware support.

مقدمه
در سال‌های اخیر با پیشرفت فناوری و گسترش و ارتقا بسترهای سخت‌افزاری مناسب برای پردازش‌های نرم‌افزاری، استفاده از فناوری و یاری جستن از آن در کاربردهای تشخیص هوشمند فراهم ‌شده است. یکی از این موارد تشخیص هوشمند که می‌تواند تا حدود زیادی در پیشگیری از سوانح و رویدادهای بعضاً جبران‌ناپذیر مؤثر باشد، تحلیل و تشخیص ناهنجاری در مسیر حرکت افراد مسن است که به‌طور ویژه‌ای در سال‌های اخیر موردتوجه پژوهشگران این حوزه قرار گرفته است.
صنعتی شدن جوامع، پیامدهای متفاوتی را در برداشته است که یکی از پیامدهای اجتماعی آن، تمایل یا اجبار به زندگی به‌صورت انفرادی در افراد کهن‌سال است. این مشکل از جوانب متعددی می‌تواند موردبحث قرار گیرد که در این مقاله مشکلات نظارتی مربوط به رفت‌وآمد فرد کهن‌سال موردتوجه قرار گرفته است.
افراد کهن‌سال بعضاً باتوجه‌به مواردی چون فراموشی و آلزایمر و یا به‌دلیل مسائل روحی روانی، عموماً رغبتی به همراه داشتن دستگاهی اضافی مانند دستگاه‌های مبتنی بر موقعیت‌یابی جهانی نداشتند و این کار را برای افرادی که وظیفه مراقبت از آن‌ها را به عهده‌دارند، دشوار می‌کند. یک راه‌حل مناسب برای این مشکل، بهره‌گیری از حس‌گر موقعیت‌یاب جهانی تعبیه‌شده در تلفن همراه فرد است که تا حدودی محدودیت‌ها و مشکلات مطرح‌شده برای حمل دستگاه اضافی را کاهش می‌دهد [1]. در این پژوهش با بهره‌گیری از تلفیق روش‌هایی نوین چون شبکه‌های عصبی عمیق و روش‌هایی کارآمد چون شبکه‌های فازی عصبی وفقی، فرایندی پیشنهاد شده است که بتوان با کمک آن در جهت نظارت خودکار بر عبور و مرور افراد کهن‌سال گامی مؤثر برداشت.
اساس کار در یک سیستم خودکار تشخیص ناهنجاری بر پایه آموزش سیستم از طریق داده‌های آموزشی‌ است. به این صورت که در ابتدا رفتارهای موردنظر در دوره زمانی مشخص جمع‌آوری و با استفاده از این داده‌های آموزشی، الگوریتم موردنظر آموزش داده می‌شود تا پس از آن، با دریافت داده‌های جدید به‌عنوان ورودی و بررسی وضعیت آن، هنجار یا ناهنجار بودن رفتار کاربر موردنظر گزارش شود [2].
در این زمینه، مشکلاتی وجود دارد، ازجمله این‌که در فرایند آموزش چنین فرایندی، به‌دلیل پیچیدگی موجود‌، داده‌های آموزشی برچسب‌دار بسیار زیادی مورد نیاز خواهد بود. همچنین به‌دلیل تنوع بالای ناهنجاری‌ها، سیستم فراتر از فرایند آموزش با داده‌های آموزشی، باید به یک فهم و درک از فرایند فوق دست‌یابد تا بتواند نمونه‌های نوین ناهنجاری را آشکار سازد. در این مقاله برای حل این مشکلات، استفاده از روشی پیشنهاد می‌شود که در آن علاوه‌بر آموزش سیستم با داده‌های آموزشی، امکان اضافه کردن قوانین نزدیک به فهم و درک انسان تحت عنوان قوانین فازی ایجاد شده است. این کار با انتخاب خودکار تعداد مشخصی از قوانین و توابع عضویت از درون داده‌ها امکان‌پذیر شده است. باتوجه‌به این نکته که استفاده از داده‌های آموزشی به‌تنهایی در یک سامانه‌ تشخیص ناهنجاری، موجب می‌شود سیستم طراحی‌شده از انعطاف لازم برای مواجهه با رویداد‌های جدیدی که تاکنون رخ نداده و تشخیص آن نیاز به درک و فهم سطح بالایی دارد، با دشواری‌هایی همراه باشد و خواسته‌های موردنظر را در کاربرد تعریف‌شده برآورده نکند. پیش‌بینی می شود بهره‌گیری از فرایندهای منطبق بر منطق فازی که با ساختارهایی مشابه آنچه در شبکه‌های عصبی در جریان است بهینه‌شده باشد، بتواند مثمر ثمر واقع شود.
علاوه‌بر موضوع انعطاف، سیستم پیشنهادی باید از ویژگی دیگری نیز برخوردار باشد که بتواند عملکرد خوبی را تضمین کند و آن استفاده به بهترین نحو ممکن از داده‌های آموزشی در قالب استخراج ویژگی‌هایی کارآمد است. برای این مورد نیز بهترین گزینه بهره‌گیری از شبکه‌های عصبی عمیق است. ساختار این شبکه‌ها به‌گونه‌ای است که علاوه‌بر امکان دستیابی به ویژگی‌های مرتبه بالاتر با استفاده از داده‌های آموزشی، امکان دسته‌بندی را نیز ممکن می‌کند. تاکنون شمار گسترده‌ای از روش‌های مبتنی بر شبکه‌های عصبی عمیق به‌طور گسترده در کاربردهای مختلف ازقبیل فناوری اطلاعات زیستی [3]، بازشناسی گفتار [4]، داده‌کاوی [5]، بازیابی اطلاعات و شناسایی الگو [6] مورداستفاده قرار گرفته است و این خود گویای این موضوع است که شبکه‌های عصبی عمیق ابزاری قوی برای کاربردهای مختلف می‌باشند.
رویکرد خاص دیگری که در این پژوهش مدنظر قرار گرفته است، بهینه‌سازی شبکه عصبی عمیق با بهره‌گیری از الگوریتم بهینه‌سازی وال یا نهنگ با هدف بهینه‌سازی ابرپارامترهای این شبکه است که منجر به بهبود نتایج دسته‌بندی با بهره‌گیری از ارائه ساختاری با ابر پارامترهای بهینه‌شده با داده ورودی خواهد شد.
ازجمله پژوهش‌های صورت‌گرفته در زمینه تشخیص ناهنجاری با استفاده از داده‌های مربوط به مسیر می‌توان به پژوهش زونیک و همکاران [7] اشاره کرد که در آن استفاده از روش‌های مرسوم یافتن پیک QRS در سیگنال ECG، برای تشخیص ناهنجاری‌ها در مسیرهای ثبت‌شده توسط دستگاه GPS مستقر در خودرو موردتوجه قرار گرفته است. این ناهنجاری‌ها که بعضاً به‌دلیل بروز اختلال در عملکرد دستگاه به‌صورت عمدی یا غیرعمدی رخ می‌دهد برای سازمان‌ها و نیروهای هر سازمان، هزینه‌هایی دربر دارد که پژوهش گفته‌شده با یافتن این ناهنجاری در اطلاعات موقعیت ثبت‌شده درپی کاهش این خسارت‌ها است. در پژوهش حاضر هدف نهایی دستیابی به دریافت دقیقی از نوع مسیر است و با این فرض صورت‌ گرفته که داده‌های ثبت‌شده از تلفن همراه کاملاً صحیح و بدون خطا ثبت ‌شده است.
در پژوهش باروسیا و همکاران [8]، با استفاده از تحلیل اطلاعات مربوط به تلفن همراه رانندگان، فرایند تشخیص ناهنجاری با هدف ایجاد یک بستر امن برای رانندگی پیاده‌سازی شده است. در این پژوهش با تحلیل داده‌های مربوط به مسیر وسایل نقلیه، فرایند تشخیص ناهنجاری صورت گرفته و ویژگی‌های مختلف کاربر در بازه زمانی مشخص، ملاک رفتار هنجار یا ناهنجار قرار گرفته است. ویژگی‌های مورداستفاده در این پژوهش شامل مسافت طی‌شده، متوسط سرعت، میانگین حسابی سرعت است و این ویژگی‌ها بر روی مجموعه دادگانی متشکل از 6853 مسیر واقعی، پیاده‌سازی شده است. دستیابی به 98 درصد تشخیص صحیح بیانگر عملکرد خوب آن در فرایند تشخیص ناهنجاری است. تفاوت این پژوهش با فرایند صورت‌گرفته در مقاله حاضر، نوع ویژگی‌هایی است که برای آموزش شبکه‌های عصبی عمیق مورد بهره‌برداری واقع شده است.
در پژوهش دبیری و همکاران [9]، با بهره‌گیری از اطلاعات حس‌گر GPS دستگاه تلفن همراه فرد و همچنین شبکه عصبی عمیق کانولوشنی به تشخیص نوع وسیله نقلیه مورداستفاده توسط فرد برای رفت‌وآمد پرداخته ‌شده است. برای این منظور، ورودی‌ها به‌صورت دنباله‌های زمانی متشکل از اطلاعات سرعت، شتاب، حرکت‌های ناگهانی و نرخ تحمل در نظر گرفته ‌شده است که به یک شبکه عصبی عمیق کانولوشنی برای دسته‌بندی وارد می‌شوند. کلاس‌های موردنظر در این پژوهش شامل پیاده‌روی، دوچرخه‌سواری، اتوبوس، رانندگی با خودرو شخصی و قطار است. در پژوهش حاضر، علاوه‌بر شبکه عصبی عمیق کانالوشنال از طبقه‌بندهای دیگری چون KNN ،SVM ،DT ،RF و MLP جهت مقایسه نتایج بهره گرفته ‌شده است. دستیابی به درصد صحت 84/8 درصد که بالاترین میزان را در میان کلیه طبقه‌بندهای فوق از آن خود کرده است، بیانگر عملکرد بسیار خوب شبکه‌های عصبی عمیق کانولوشنی نسبت به سایر روش‌های مرسوم طبقه‌بندی است. در پژوهش دبیری و همکاران [9]، از داده‌های GPS موبایل در چارچوب مسئله طبقه‌بندی داده‌ها استفاده شده است؛ درحالی‌که در این مقاله، تشخیص هنجار یا ناهنجار بودن یک عمل با استفاده از چنین داده‌هایی مطرح است.
در مقاله شاین و همکاران [10]، روشی برای تشخیص ناهنجاری با بهره‌گیری از روش‌هایی چون Faster-RCNN وMOT پیشنهاد شده است و درنهایت اطلاعات به‌دست‌آمده از این ابزارها برای تعیین احتمال ناهنجاری‌ها و تشخیص آن‌ها ترکیب می‌شود. این مقاله باتوجه‌به این نکته که داده‌های ناهنجار از تنوع بسیار بالایی برخوردارند، فرایند تشخیص ناهنجاری را به‌صورت بدون مربی پیشنهاد کرده است. داده‌های مورداستفاده در این پژوهش شامل مجموعه دادگانی است که در سال 2019 برای تشخیص مسیرهای ناهنجار شهری از روی دوربین‌های نظارتی طرح‌ریزی ‌شده است. تفاوت این پژوهش با مقاله پیش‌رو در نحوه ایجاد مسیرهای موجود به‌عنوان ورودی شبکه‌های عصبی عمیق و همچنین نوع شبکه عصبی عمیق مورداستفاده است. در پژوهش حاضر مسیرها از روی داده‌های GPS تلفن همراه ایجاد می‌شود، درحالی‌که در این پژوهش مسیرها از دنباله‌های ویدیویی استخراج می‌شود. علاوه‌بر آن در مقاله پیش‌رو از شبکه عصبی عمیق کانولوشنی با مشخصات مخصوص به خود بهره گرفته ‌شد، درحالی‌که در این مقاله از ساختارهایی استفاده شده که به‌صورت مشخص پیش از این ارائه شده است.
در پژوهش دویس و همکاران [11] نیز یک مدل تشخیص ناهنجاری برپایه شبکه‌های عصبی عمیق با بهره‌گیری از داده‌های زمانی مربوط به شبکه حمل و نقل ارائه شده است. در پژوهش مورد اشاره، از شبکه‌های مرسوم حافظه طولانی-کوتاه مدت بهبودیافته با کمک یک تابع برازش برگرفته‌شده از تحلیل مقدار حدی در فرایند تشخیص ناهنجاری استفاده شده است. روش پیشنهادی در مقاله یادشده، 7 مجموعه داده متنوع را که برگرفته از داده‌های واقعی مانند تاکسی‌های شهر نیویورک یا مسیر تاکسی‌های شهر بنگلور هند است و در حوزه تشخیص ناهنجاری شناخته شده است، مورد ارزیابی قرار داده است. تفاوت پژوهش گفته‌شده با روش پیشنهادشده در این مقاله، این است که در آن پژوهش، از اطلاعات حوزه زمان در قالب شبکه‌های حافظه‌دار طولانی-کوتاه مدت بهره‌برداری شده است. حال آنکه در این پژوهش، کل اطلاعات مسیر حرکت در قالب یک تصویر به شبکه کانولوشنی داده می‌شود و از ترکیب یک شبکه فازی با شبکه کانولوشنی بهره‌برداری می‌شود.
در ادامه این مقاله، ابتدا در بخش دوم مبانی مورداستفاده برای روش پیشنهادی ارائه می‌شود. سپس در بخش سوم روش پیشنهادی در قالب سه بخش استخراج داده، آموزش سیستم و ارزیابی سیستم مورد بررسی قرار خواهد گرفت. در بخش چهارم آزمایش‌های انجام‌شده همراه با نتایج حاصله ارائه خواهد شد. درنهایت قسمت انتهایی نیز به جمع‌بندی و نتیجه‌گیری از پژوهش صورت‌گرفته اختصاص دارد.

مواد و روش‌ها
به‌منظور ایجاد بستری مناسب برای مطرح کردن روش پیشنهادی، این بخش به ارائه ابزارهایی اختصاص دارد که در روش پیشنهادی مورداستفاده قرار گرفته است. اولین ابزاری که در این بخش مورد بررسی قرار می‌گیرد، شبکه عصبی عمیق کانولوشنی است.

شبکه عصبی عمیق کانولوشنی
شبکه‌های عصبی عمیق کانولوشنی یکی از پرکاربردترین ساختارهایی هستند که در پژوهش‌های نوین حوزه بازشناسی الگو و بینایی ماشین مورداستفاده قرار می‌گیرند.
در این شبکه‌ها لایه‌های متنوعی تعریف شده است که با استفاده از اصول و قواعدی منسجم، عملکردی مشخص دارند. به‌طورکلی، یک شبکه کانولوشنی از سه لایه اساسی، شامل لایه کانولوشن, لایه پولینگ و لایه تماماً متصل تشکیل شده است. هرکدام از لایه‌های یادشده، وظیفه‌ای مشخص را به عهده دارند.
برای این دسته از شبکه‌های عصبی فرایند آموزش شامل دو مرحله اصلی است. ابتدا مرحله جلوسو و سپس مرحله پس انتشار خطا. در مرحله جلوسو، ورودی به لایه ابتدایی شبکه وارد می‌شود و فرایند ضرب نقطه‌ای بین ورودی و مؤلفه‌های هر نورون و نهایتاً فرایند کانولوشن در هر لایه صورت می‌گیرد. درنهایت خروجی شبکه محاسبه می‌شود. در اینجا به‌منظور تنظیم پارامترهای شبکه و یا به‌عبارت دیگر فرایند آموزش، از نتیجه خروجی به‌دست‌آمده برای اندازه‌گیری خطای شبکه استفاده می‌شود. برای این منظور، خروجی شبکه را با استفاده از یک تابع خطا با پاسخ صحیح مقایسه می‌شود و بدین‌صورت میزان خطا مورد محاسبه قرار می‌گیرد.
در مرحله بعدی، براساس خطای محاسبه‌شده، مرحله پس انتشار خطا آغاز می‌شود. در این مرحله با لحاظ کردن الگوریتم‌هایی مانند گرادیان نزولی، مشتق تابع خطا نسبت به هر پارامتر باتوجه‌به قانون زنجیره‌ای محاسبه و تمامی پارامترها باتوجه‌به تأثیری که بر خطای ایجادشده در شبکه دارند، تغییر پیدا می‌کنند. بعد از به‌روزرسانی پارامترها مرحله جلوسو و پس از آن مرحله پس انتشار تکرار می‌شود و نهایتاً بعد از تکرار تعداد مناسبی از این مراحل، آموزش شبکه به اتمام می‌رسد. در این فرایند، ابرپارامترهایی ازقبیل نرخ آموزش، نرخ مومنتوم در فرایند گرادیان نزولی، نرخ متعادل‌سازی و غیره تعریف می‌شوند که تغییر در آن‌ها می‌تواند با تغییر در نرخ نهایی طبقه‌بندی همراه باشد.
در مرحله آزمایش نیز پس از وارد کردن داده تحت آزمایش به ورودی شبکه عصبی از پیش آموزش‌دیده‌شده در خروجی لایه انتهایی که لایه تماماً متصل است، میزان تعلق هر داده به کلاس‌های مختلف مشخص می‌شود.
در این پژوهش، برای بهبود عملکرد شبکه عصبی عمیق، بهینه‌سازی 3 ابرپارامتر نرخ آموزش، نرخ مومنتوم در فرایند گرادیان نزولی و نرخ متعادل‌سازی بهره موردتوجه قرار گرفته است که در ادامه بررسی می‌شود.

نرخ آموزش و مومنتوم
استفاده از الگوریتم مومنتوم در چارچوب گرادیان نزولی تصادفی یکی از بهترین و شناخته‌شده‌ترین شیوه‌های مورداستفاده برای به‌روزرسانی وزن‌ها در شبکه‌های عصبی به شمار می‌رود. در این روش ماتریس وزن شبکه، W، با ترکیب خطی منفی گرادیانت تابع هزینه یعنی -∇ L(W) و مقدار تغییرات وزن در مرحله قبل Vt به‌روزرسانی می‌شود (فرمول شماره 1):

در این رابطه، α نرخ یادگیری نامیده می‌شود که تأثیر مقدار گرادیانت در فرآیند به‌روزرسانی را تعیین می‌کند و μ مقدار مومنتوم است که وزن آپدیت قبلی را تعیین می‌کند.
به‌طورکلی به‌منظور محاسبه مقدار جدید تغییرات بردار پارامترها، Vt+1 و بنابراین محاسبه ماتریس Wt+1 در تکرار t+1 با داشتن مقدار به‌روزرسانی قبلی Vt و ماتریس وزن فعلی Wt از عبارت فوق استفاده می‌شود:
یکی از چالش‌های مهم برای به دست آوردن بهترین نتایج، مشخص کردن ابرپارامترهای α و μ است که کمی تغییر می‌تواند جواب نهایی را دستخوش تغییرات زیادی کند.

بهره نرخ متعادل‌سازی
معمولاً در فرایندهای یادگیری عمیق هدف کلی کمینه کردن تابع هزینه‌ای است که در فرمول شماره 2 قابل مشاهده است:

در عبارت فوق، L می‌تواند هر تابع هزینه‌ای ازجمله خطای دسته‌بندی در نظر گرفته شود. برای بهبود نتایج دسته‌بندی متعادل‌سازی به‌عنوان ابزاری کارآمد پیشنهاد می‌شود و پارامتری به‌منظور تنظیم وزن‌ها اضافه می‌شود و فرمول شماره 3 حاصل خواهد شد:

در فرمول شماره 3، λ پارامتر تنظیم است و F به‌عنوان پارامتر نرمال فروبینیوس شناخته می‌‌شود و درواقع برابر با مجذور نرمال یک ماتریس خواهد بود. تعیین مقدار مناسب λ نیز از مسائل مهمی است که باید مدنظر قرار گیرد. این پارامتر وابسته به شرایط می‌تواند تنظیم شود؛ یعنی مقدار بالای وزن‌ها با در نظر گرفتن یک مقدار کم برای λ قابل‌کنترل خواهد بود و به‌طور مشابه مقدار زیاد برای λ به‌منظور تنظیم تأثیر بیشتر وزن‌ها در نظر گرفته می‌شود. ازآنجایی‌که تابع هزینه باید حداقل‌سازی شود، تناسب مطرح‌شده منطقی به نظر می‌‌رسد و با اضافه کردن مجذور نرم ماتریس وزن‌ها و ضرب آن در پارامتر نظم‌‌دهی، وزن‌‌ها تنظیم می‌شوند و تابع هزینه کاهش می‌‌یابد.
در این مقاله، یکی از بهترین الگوریتم‌های تکاملی مورداستفاده قرار می‌گیرد، تا با کمک آن مقدار بهینه برای این 3 ابرپارامتر پیدا شود. الگوریتم در نظر گرفته‌شده، الگوریتم وال نامیده می‌شود که در ادامه مورد بررسی قرار خواهد گرفت.

الگوریتم وال
در این بخش به معرفی الگوریتم فرا ابتکاری وال پرداخته می‌شود که میرجلیلی و همکاران در سال 2016 (1394) ارائه کرده‌اند [12]. نهنگ‌ها که یکی از بزرگترین موجودات عالم هستند، با نژاد‌های متفاوتی در سراسر گیتی حضور دارند. یکی از بزرگترین نژاد نهنگ‌ها، نهنگ گوژپشت است که ابعاد نهنگ گوژپشت حدود اندازه یک اتوبوس یا حتی بیشتر از آن است. نکته جالب در مورد این دسته از نهنگ‌ها، روش شکار کردن آن‌ها است. این رفتار تحت عنوان روش تغذیه حباب تور نام‌گذاری شده است. اولویت نهنگ‌های گوژپشت شکار کریل‌ها و یا ماهی‌های کوچکی است که به‌صورت دسته‌ای در مجاورت سطح آب شنا می‌کنند. برای این منظور وال‌ها حباب‌های شاخصی در امتداد یک دایره یا مسیر‌هایی مشخص ایجاد می‌کند و با این فرایند امکان تشخیص مکان شکار و محاصره ماهی‌ها برای نهنگ‌های گوژپشت فراهم خواهد شد. به‌دلیل اینکه مکان طراحی بهینه در فضای جست‌وجو از راه مقایسه تشخیص داده نمی‌شود، WOA فرض می‌کند که بهترین راه‌حل حاضر، شکار هدف است و بعد از اینکه بهترین عامل جست‌وجو شناسایی شد، سعی می‌شود عوامل دیگر جست‌وجو مکان خود را نسبت به بهترین عامل جست‌وجو، به‌روزرسانی کنند. این رفتار از طریق فرمول‌های 4، 5، 6 و 7 زیر بیان شده است [11]:

در فرمول شماره 4 و 5 منظور از «.» ضرب داخلی است. همچنین k معرف تکرار جاری بوده، و بردارهای ضرایب، بردار مکان بهترین راه‌حل به‌دست‌آمده جاری و نهایتاً بردار مکان است. در صورت وجود راه‌حل بهتر، در هر تکرار باید به‌روزرسانی شود. بردار و به‌صورت فرمول شماره 6 و 7 محاسبه می‌شود [12]:

که به‌صورت خطی از مقدار 2 تا صفر و در طی تکرار‌های متوالی کم می‌شود (در هر 2 فاز اکتشاف و استخراج) و نیز بردار تصادفی در فاصله صفر تا 1 است. حاصل فرمول شماره 6 با محاسبه ضرب داخلی مورد محاسبه قرار می‌گیرد.

روش حمله حباب تور (فاز استخراج)
برای مدل‌سازی رفتار حباب تور، 2 روش زیر طراحی‌شده است که مورد بررسی قرار می‌گیرد:

مکانیسم محاصره‌ انقباضی
این رفتار ازطریق افزایش مقدار در فرمول شماره 6 حاصل می‌شود. به یاد داشته باشید که محدوده نوسان به‌وسیله کاهش می‌یابد. به‌عبارت دیگر، مقداری تصادفی در فاصله تا - است و در طی تکرارها، از مقدار 2 تا صفر کاهش می‌یابد. با انتخاب مقادیر تصادفی در فاصله‌ 1- تا 1، می‌توان مکان جدید عامل جست‌وجو را در هرجایی بین مکان اصلی عامل و مکان بهترین عامل کنونی تعریف کرد.

مکان در حال به‌روزرسانی مارپیچی
این روش در ابتدا فاصله بین نهنگ قرارگرفته در مختصات و طعمه موجود در و را محاسبه می‌کند. معادله‌ای مارپیچی بین موقعیت نهنگ و طعمه تشکیل شد تا حرکت حلزونی شکل نهنگ گوژپشت را تقلید کند (فرمول شماره 8):

فرمول فوق به فاصله اولین نهنگ تا طعمه اشاره دارد (بهترین راه‌حل به‌دست‌آمده تا اینجا)، ثابتی برای تعریف شکل مارپیچ لگاریتمی است و عددی تصادفی بین 1- تا 1 است. نهنگ گوژپشت، حول طعمه در امتداد یک دایره‌ انقباضی و هم‌زمان در مسیر مارپیچی شکلی شنا می‌کند. برای مدل‌سازی این رفتار هم‌زمان، فرض شده است که نهنگ با احتمال 50 درصد از بین مکانیسم محاصره‌ انقباضی و یا مدل مارپیچی یکی را انتخاب می‌کند تا موقعیت نهنگ‌ها در طول بهینه‌سازی به‌روزرسانی شود. مدل ریاضی بدین‌صورت است (فرمول شماره 9):

در این فرمول عددی تصادفی بین صفر تا 1 است. علاوه‌بر روش حباب تور، نهنگ‌های گوژپشت به‌صورت تصادفی به دنبال طعمه می‌گردند. مدل ریاضی جست‌وجو بدین‌صورت است:

جست‌وجوی برای طعمه (فاز اکتشاف)
روشی مشابه بر مبنای واریانس بردار را می‌توان جهت جست‌وجوی شکار (اکتشاف) به کار گرفت. درحقیقت، نهنگ‌های گوژپشت، برطبق مکان یکدیگر، به‌صورت تصادفی به جست‌وجو می‌پردازند. بنابراین، بردار را با مقادیر تصادفی بزرگتر از 1 و یا کمتر از 1- به‌کار گرفته ‌شد تا عامل جست‌وجو را مجبور به دور شدن از نهنگ مرجع کند. برخلاف فاز استخراج، برای به‌روزرسانی موقعیت عامل جست‌وجو در فاز اکتشاف به‌جای استفاده از داده‌های بهترین عامل جست‌وجو، از انتخاب تصادفی عامل بهره برده شده است. این مکانیسم به همراه بر اکتشاف تأکید دارند و به WOA اجازه می‌دهند تا جست‌وجویی سراسری را انجام دهند. مدل ریاضی در فرمول شماره 10 قابل مشاهده است:

در فرمول شماره 11، بردار موقعیت تصادفی انتخاب‌شده (نهنگ تصادفی) از جمعیت جاری است. الگوریتم WOA با مجموعه‌ای از راه‌حل‌های تصادفی شروع به کار می‌کند. در هر تکرار، عوامل جست‌وجو، موقعیت خود را باتوجه‌به عامل جست‌وجویی که تصادفی انتخاب‌ شدند و با بهترین راه‌حل به‌دست‌آمده‌ جاری، به‌روزرسانی می‌کنند. مؤلفه برای فراهم آوردن اکتشاف و استخراج، به‌ترتیب از مقدار 2 تا صفر کاهش می‌یابد. یک عامل جست‌وجوی تصادفی در حالت انتخاب می‌شود، این در حالی است که بهترین راه‌حل زمانی انتخاب می‌شود که جهت به‌روزرسانی موقعیت عوامل جست‌وجو، باشد. بسته به مقدار ، وال این قابلیت را دارد تا بین حرکت دایروی و یا مارپیچی، یکی را انتخاب کند. درنهایت، الگوریتم وال با ارضای شرایط خاتمه، پایان می‌گیرد. شبه‌کد مربوط به الگوریتم فوق در تصویر شماره 1 ارائه شده است [12].

در انتها باید خاطرنشان کرد خروجی به‌دست‌آمده در این شبه‌کد، عبارت است از مقدار بهینه 3 ابرپارامتر که درنهایت در شبکه عصبی عمیق نهایی پیشنهادی این پژوهش مورداستفاده قرار خواهد گرفت.

یافته‌ها
روش پیشنهادی
در این بخش، روش پیشنهادی که شامل قسمت‌های اساسی استخراج داده‌های ورودی و ازدیاد آن (داده افزایی)، شبکه عصبی عمیق کانولوشنی بهبودیافته و شبکه عصبی فازی تطبیقی است، به‌تفصیل بررسی می‌شود. در تصویر شماره 2، این بخش‌های اساسی قابل‌ملاحظه است.

همان‌طورکه در تصویر شماره 2 قابل‌مشاهده است، اولین بخش مربوط به مجموعه داده‌ها است که در ادامه مورد بررسی قرار می‌گیرد. تلفیق 2 طبقه‌بند موردنظر در سطح تصمیم است و مدل نهایی ساختاری دراد که از مزیت‌های هر 2 طبقه‌بند بهره می‌گیرد. در توضیح بیشتر این شکل می‌توان به این نکته اشاره کرد که برای آموزش بهتر شبکه عصبی عمیق باتوجه‌به ضروری بودن تعداد بالای داده آموزشی استفاده از فرایند ازدیاد داده بسیار حائز اهمیت است، درحالی‌که برای سیستم تطبیقی استنتاج عصبی فازی این نیاز کمتر محسوس است. نکته دیگر در این شکل، تلفیق 2 طبقه‌بند در دستیابی به مدلی است که می‌توان از آن برای دسته‌بندی نهایی استفاده کرد. این مدل از 2 طبقه‌بند آموزش‌دیده تشکیل شده است که نتایج پیاده‌سازی آن بر روی داده‌های جدید با ادغام در سطح تصمیم به دست می‌آید.

استخراج داده‌های ورودی
برای استخراج مجموعه دادگان مربوط به حس‌گر تلفن همراه از نرم‌افزار GeoTracker استفاده می‌شود. در تصویر شماره 3 شمای کلی از نرم‌افزار موردنظر قابل‌مشاهده است.

در این نرم‌افزار اطلاعات مربوط به حس‌گر موقعیت تلفن همراه در مدت‌زمانی که فرد موردنظر از منزل خارج می‌شود، ذخیره می‌شود و در صورت اتصال به اینترنت در فضای ابری قابل بارگذاری و استفاده خواهد بود. این ذخیره‌سازی با فرمت KML صورت می‌گیرد. گام دوم انتقال اطلاعات با فرمت KML به نرم‌افزار QGIS است. با بهره‌گیری از این نرم‌افزار مسیر موردنظر استخراج می‌شود و در قالب یک تصویر در اختیار قرار می‌گیرد. روش پیشنهادی برای استخراج داده به‌صورت گرافیکی در تصویر شماره 4 ارائه شده است.

در این تصویر برای نمایش بهتر مسیر از نرم‌افزار گوگل ارث بهره گرفته ‌شده است. قبل از استفاده از مسیرها، فرایند پیش‌پردازش روی آن صورت می‌گیرد تا تصویر نهایی به‌صورت باینری آماده استفاده شود. مبدا و مقصد انتخاب‌شده شامل منزل تا نزدیک‌ترین مرکز درمانی به آن است که فرد سالمند جهت دریافت خدمات درمانی دوره‌ای به آنجا مراجعه می‌کند. داده‌های ثبت‌شده که در قالب 72 مسیر مجزا ذخیره‌شده است، دربرگیرنده جزئیات مسیر ثبت‌شده توسط حس‌گر موقعیت‌یاب تلفن همراه فرد سالمند طی ارتباط برخط با ماهواره‌های GPS بوده و به‌صورت آنی ذخیره شده است. دستگاه تلفن همراه مورداستفاده از برند سامسونگ مدل Galaxy S7 SM-G930FD بوده که به سیستم‌عامل اندروید نسخه 6،0،1 مجهز است. حس‌گر موقعیت‌یاب این دستگاه دارای فناوری GLONASS است و با دقت 30 سانتی‌متر به ثبت موقعیت می‌پردازد.
پس از فراهم کردن مجموعه داده‌ها برای ایجاد بستری مناسب در جهت آموزش بهتر شبکه عصبی عمیق، از فرایند ازدیاد داده بهره گرفته‌ شده است. برای این منظور از شیوه‌های متعددی چون چرخش و انتقال در راستای عرض و انتقال در راستای طول استفاده شده است. درنتیجه پس از فراهم کردن داده‌های مورد نیاز، گام بعد به آموزش طبقه‌بندی اختصاص خواهد یافت.

آموزش طبقه‌بند
همان‌طورکه در مقدمه بیان شد یکی از مهم‌ترین نوآوری‌های این پژوهش، بهره‌گیری از تلفیق 2 طبقه‌بند است. طبقه‌بند شبکه عصبی عمیق بهبودیافته برای دستیابی به مدلی مناسب از داده‌های ورودی و طبقه‌بند مبتنی بر شبکه عصبی فازی برای دستیابی به انعطاف لازم در مواجهه با داده‌های ناهنجار جدید. در ابتدا شبکه عصبی عمیق کانولوشنی مورداستفاده همراه با فرایند موردنظر برای بهینه‌سازی آن مطرح و سپس طبقه‌بند بر پایه شبکه عصبی فازی بررسی می‌شود.

شبکه عصبی عمیق بهبودیافته
چنانچه در قسمت‌های قبل عنوان شد، نرخ آموزش اولیه، مومنتوم و نرخ متعادل‌سازی L2، ابرپارامترهایی هستند که ضرورت دارد تحت فرایند بهینه‌سازی مقدار مناسب آن‌ها با به‌کارگیری فرایند بهینه‌سازی تعیین شود. در این بخش ساختاری که در آن این ابر پارامترها بهینه‌سازی می‌شوند، ارائه می‌شود. در تصویر شماره 5 بلوک دیاگرام مربوط به این ساختار قابل‌مشاهده است.

در فرایند بهینه‌سازی ابر پارامترها، ابتدا مقادیری تصادفی در محدوده‌ای مشخص برای حالت اولیه ابر پارامترها تعیین می شود و با بهره‌گیری از آن‌ها شبکه عصبی کانولوشنی اولیه شکل می‌گیرد. در گام بعد با این مقادیر بر روی مجموعه دادگان اعتبارسنجی، شبکه فوق اجرا شد و باتوجه‌به اینکه برچسب داده‌های پیش‌گفت مشخص است، تابع هزینه محاسبه می‌شود. با بهره‌گیری از الگوریتم بهینه‌سازی وال و بهبود مقادیر ابر پارامترها در هر تکرار توسط آن، پیش‌بینی می‌شود که شبکه عصبی کانولوشنی مورداستفاده برای دسته‌بندی نهایی، همواره به سمت ساختار مناسب و قابل‌اطمینان‌تری پیش رود.

طبقه‌بندی مبتنی بر سیستم تطبیقی استنتاج عصبی فازی
سیستم تطبیقی استنتاج عصبی فازی را می‌توان یکی از کارآمدترین فرایند‌های استنتاج فازی به شمار آورد که به‌علت بهره‌گیری از قاعده و قانون، همانند فرایند‌های فازی است و به این دلیل که به‌صورت یک شبکه عصبی آموزش می‌بیند، شبکه عصبی است. به‌بیانی دیگر می‌توان گفت سیستم تطبیقی استنتاج عصبی فازی، یک شبکه قابل آموزش است که ازنظر عملکرد کاملاً مشابه فرایند استنتاج فازی است و از مزیت‌های شبکه عصبی بهره می‌برد. در اینجا مفروض است که x و y دو ورودی شبکه موردنظر و خروجی این شبکه نیز متغیر z است [13]. حال اگر قوانین به‌صورت فرمول‌ شماره 12 باشند :

و اگر برای غیرفازی‌ساز از غیرفازی‌ساز میانگین مراکز استفاده شود، درنهایت ساختار معادل سیستم تطبیقی استنتاج عصبی فازی به‌صورت تصویر شماره 6 خواهد بود:

در ادامه به تشریح لایه‌های انتخابی در فرمول‌های شماره 13، 14، 15، 16، 17، 18 و 19 پرداخته می‌شود.
لایه 1: در این لایه ورودی‌ها از توابع عضویت عبور می‌کنند.

توابع عضویت هر تابع در اکثر موارد به‌صورت توابع گوسی انتخاب می‌شود که به‌صورت یک تابع زنگی شکل خواهد بود:

که مجموعه پارامترها هستند. پارامترهای این لایه به پارامترهای اولیه معروف هستند.
لایه 2: خروجی این لایه ضرب سیگنال‌های ورودی است که درواقع معادل قسمت اگر قوانین هستند.

لایه 3: خروجی این لایه متعادل‌سازی‌شده لایه قبلی است:

لایه 4: خروجی این لایه نیز به‌صورت زیر خواهد بود:

لایه 5: خروجی این لایه نیز خروجی کلی سیستم است:

مجموع ساختار تشریح شده در بالا شبکه سیستم تطبیقی استنتاج عصبی فازی مورداستفاده را شکل می‌دهد. باتوجه‌به حاصل پژوهش‌های صورت‌گرفته بر روی طبقه‌بندی‌هایی برمبنای این ساختار، می‌توان درصد صحت بسیار خوبی را از آن متصور شد.

اعتبار سنجی
در پژوهش‌های مرتبط با حوزه بینایی ماشین و بازشناسی الگو از معیارهای متفاوتی جهت اعتبارسنجی مدل و ارزیابی نتایج استفاده می‌شود، ازجمله این معیارها می‌توان به صحت، حساسیت و قدرت تشخیص اشاره کرد که 3 مؤلفه مهم برای ارزیابی نتیجه یک دسته‌بندی دوحالته یا دودویی هستند. زمانی که بتوان داده‌ها را به 2 گروه تقسیم کرد، دقت نتایج یک آزمایش که اطلاعات را به این 2 دسته تقسیم می‌کند، با استفاده از این 3 شاخص‌ قابل اندازه‌گیری و توصیف است. حساسیت بیانگر نسبتی از موارد مثبت است که آزمایش، آن‌ها را به‌درستی به‌عنوان مثبت علامت‌گذاری می‌کند. قدرت تشخیص به معنا و مفهوم نسبتی از موارد منفی است که آزمایش، آن‌ها را به‌درستی به‌عنوان منفی علامت‌گذاری می‌کند. میزان صحت نیز عملکرد طبقه‌بند را روی هر 2 دسته به‌طور هم‌زمان مورد سنجش قرار می‌دهد.
به‌طورکلی برای محاسبه معیارهای صحت، قدرت تشخیص و حساسیت، ابتدا چهار مؤلفه زیر باید مورد محاسبه قرار گیرند::
مثبت صحیح: داده ناهنجار، به‌درستی ناهنجار تشخیص داده شود.
مثبت کاذب: داده هنجار، به اشتباه ناهنجار تشخیص داده شود.
منفی صحیح: داده هنجار، به‌درستی هنجار تشخیص داده شود.
منفی کاذب: داده ناهنجار، به اشتباه هنجار تشخیص داده شود.
به بیان ریاضی، حساسیت حاصل تقسیم موارد مثبت واقعی به حاصل جمع موارد مثبت واقعی و موارد منفی کاذب است (فرمول شماره 20).

منظور از TP مثبت صحیح و FN منفی کاذب است.
به همین ترتیب، قدرت تشخیص حاصل تقسیم موارد منفی واقعی به حاصل جمع موارد منفی واقعی و مثبت کاذب است (فرمول شماره 21).

منظور از TN منفی صحیح و FP مثبت کاذب است.
مؤلفه صحت، متداول‌ترین، اساسی‌ترین و ساده‌ترین معیار اندازه‌گیری کیفیت یک دسته‌بند است و عبارت است از میزان تشخیص صحیح دسته‌بند در مجموع 2 دسته. این کمیت درواقع نشان‌گر میزان الگوهایی است که درست تشخیص داده شده‌اند و براساس ماتریس درهم-ریختگی، به شکل فرمول شماره 22 تعریف می‌شود.

ابزار دیگری که می‌توان در جهت ارزیابی استفاده کرد، ابزار ماتریس درهم‌ریختگی است که به‌صورت بصری تمام مؤلفه‌های فوق را دربر می‌گیرد. در تصویر شماره 7 این اطلاعات قابل‌ملاحظه است.

پس از بررسی جزئیات روش پیشنهادی و معیارهای ارزیابی، به شبیه‌سازی و یافتن نتایج خروجی پرداخته می‌شود تا درنهایت بتوان شیوه پیشنهادی را تحلیل کرد.

آزمایش‌ها و نتایج شبیه‌سازی
پس از مطرح کردن جزئیات، قواعد و اصول روش پیشنهادی در این قسمت، شبیه‌سازی آن بررسی شده است و نتایج حاصل از آن هم بررسی می‌شود.

معرفی پایگاه داده
یکی از مهم‌ترین بخش‌های پیاده‌سازی هر روش، ماشین بینایی و بازشناسی الگویی بهره‌گیری از پایگاه داده‌ای است که قابلیت بالایی از خود در ارزیابی مناسب از روش پیشنهادی ارائه دهد. برای این پژوهش از مجموعه دادگانی متشکل از 46 مسیر نرمال و 26 مسیر ناهنجار که در تصویر شماره 8 قابل‌مشاهده می‌باشند، استفاده شده است.

در شکل فوق، مسیرهای هنجار در سمت چپ بالا و پایین و با رنگ قرمز و مسیرهای ناهنجار در قسمت راست بالا و پایین و با رنگ سبز قابل ‌مشاهده است. مسیرهای هنجار مسیرهایی هستند که در دسته مسیرهای عادی فرد، از مبدأ منزل به مقصد مرکز درمانی موردنظر قرار می‌گیرند و مسیرهای ناهنجار مواردی هستند که با طی مسیری غیرعادی بین این دونقطه برقرار می‌شوند. از میان 72 مسیر فوق، 70 درصد برای آموزش سیستم و 30 درصد برای آزمودن آن مورداستفاده قرار گرفته است. انتخاب داده‌ها به‌صورت هم‌وزن و تصادفی انجام‌شده که درنهایت 22 مسیر هنجار و 8 مسیر ناهنجار را در زمره داده‌های آزمون قرار می‌دهد.

تنظیمات شبکه عصبی کانولوشنی
برای شبیه‌سازی روش پیشنهادی از یک شبکه عصبی عمیق با لایه‌های زیر استفاده شده است که در ادامه به تشریح آن پرداخته می‌شود.
لایه ورودی با ابعاد (1، 32، 32) مطابق ورودی است که البته تمام تصاویر مربوط به داده‌ها به این ابعاد تغییر سایز پیدا می‌کنند تا یکسان‌سازی صورت گیرد.
1. لایه کانولوشنی ابعاد فیلترها (3،3)، اندازه گام1؛
2. لایه متعادل‌سازی دسته‌ای؛
3. لایه رلو؛
4. جمع‌بندی بیشینه؛
5. لایه کانولوشنی ابعاد فیلترها (3،3)، اندازه گام1؛
6. لایه متعادل‌سازی دسته‌ای؛
7. لایه رلو؛
8. جمع‌بندی بیشینه؛
9. لایه کانولوشنی ابعاد فیلترها (3، 3)، اندازه گام1؛
10. لایه متعادل‌سازی دسته‌ای؛
11. لایه رلو؛
12. لایه جمع‌بندی میانگین؛
13. لایه تماماً متصل؛
14. لایه سافتمکس؛
15. لایه طبقه‌بندی خروجی.
تنظیمات آموزش شبکه نیز به این صورت در نظر گرفته ‌شده است که نرخ آموزش اولیه α و قاعده یادگیری بر مبنای گرادیان نزولی با مومنتوم μ و تعداد تکرارها 50 و نرخ متعادل‌سازی R، نرخ کناره‌گیری از عضویت 0/1 مورداستفاده قرار گرفته برای ازدیاد داده‌ها نیز از قاعده چرخش و انتقال در جهت x و y با نرخ چرخش منفی 10 تا مثبت 10 درجه و نرخ انتقال منفی 4 تا مثبت 4پیکسل بهره گرفته ‌شده است. تعداد داده‌ها را تا 1280 برابر افزایش می‌دهد، به‌عبارت‌دیگر تعداد مسیرهای آموزشی از 42 مسیر به 53760 مسیر ارتقا پیدا می‌کند. مقادیر نرخ آموزش اولیه، مومنتوم و نرخ متعادل‌سازی L2 در هر تکرار تحت بهینه‌سازی قرار می‌گیرد تا نهایتاً به بهینه‌ترین مقدار خود دست پیدا کند.
تنظیمات شبکه سیستم تطبیقی استنتاج عصبی فازی
شبکه سیستم تطبیقی استنتاج عصبی فازی مورداستفاده در این پژوهش از نوع سوگنو [13] و تابع مثلثی با E=0/1514 و R2=0/97 که در آن تعداد قوانین 10 در نظر گرفته ‌شده است. تعداد توابع عضویت مورداستفاده برابر 2 و تعداد تکرارها برابر 50 لحاظ شده است.

نتایج شبیه‌سازی
در این بخش نتایج حاصل از شبیه‌سازی مورد بررسی قرار می‌گیرد. قبل از آن باید خاطرنشان شد کلیه نتایج حاصل از شبیه‌سازی در رایانه‌ای با مشخصات CORI9 GPU 1080TITAN GEFORCE 64GRAM واقع در مرکز محاسبات سنگین دانشگاه فردوسی مشهد پیاده‌سازی شده است. سیستم‌عامل مورداستفاده ویندوز 10 و کلیه محاسبات با با نرم‌افزار متلب انجام ‌شده است. در ابتدا مقدار بهینه به‌دست‌آمده برای مؤلفه‌های شبکه CNN را در جدول شماره 1 ملاحظه می شود.

برای به دست آوردن نتایج جدول شماره 1، 20 بار مقدار تصادفی برای مقدار اولیه ابرپارامترها در محدوده مشخص قابل‌تعریف، تعیین شد و میانگین و واریانس مقادیر نهایی به‌دست‌آمده برای آن‌ها پس از اجرای کد برای این 20 مرتبه در جدول شماره 1 گزارش شد. برای مقایسه بهتر روش پیشنهادی، به‌جای الگوریتم وال از الگوریتم PSO و GA نیز برای بهینه‌سازی پارامترها بهره گرفته شد که درنهایت مقادیر نهایی برای این 3 حالت نیز در جدول شماره 1 قابل‌مشاهده است. برای این شبیه‌سازی از الگوریتم GA با اندازه جمعیت اولیه 100، تعداد دفعات تکرار الگوریتم (تعداد نسل‌ها) 10 و نرخ جهش 1 درصد استفاده شده است. الگوریتم PSO با مشخصات ابعاد جمعیت اولیه 100، نرخ میرایی 0/99، ضریب شتاب شخصی2، ضریب شتاب جمعی2 و الگوریتم وال نیز با مشخصات جمعیت اولیه 100 مورداستفاده قرار گرفته ‌است.
در این قسمت برای ارائه نتایج در گام نخست، ابتدا شبکه CNN بدون بهینه‌سازی مورداستفاده قرار گرفت که در تصویر 9-الف نتیجه حاصل مشاهده می‌شود.

در گام بعد شبکه سیستم تطبیقی استنتاج عصبی فازی مورداستفاده را به داده‌ها اعمال شدند. در تصویر 9-ب، نتایج حاصله نشان داده شده است. با مقایسه تصاویر 9-الف و 9-ب می‌توان دریافت که عملکرد شبکه سیستم تطبیقی استنتاج عصبی فازی روی داده‌های ناهنجار و شبکه CNN در تشخیص داده‌های هنجار بهتر عمل می‌کند.
درمجموع روش سیستم تطبیقی استنتاج عصبی فازی روی تمام داده‌ها عملکرد بهتری دارد. در تصاویر شماره 9-الف، عملکرد شیکه کانولوشنی قبل از بهینه‌سازی ابرپارامترهای آن نشان داده شده است و در این پژوهش در نهایت از الگوریتم بهینه‌سازی‌شده CNN استفاده شد که متعاقباً توضیحات لازم ارائه می‌شود. این شکل تنها برای یک مقایسه اولیه مورداستفاده قرار گرفته است. باتوجه‌به تفاوت عملکرد این 2 شبکه بر روی داده‌های هنجار و داده‌های ناهنجار،پیش‌بینی می‌شود تلفیق این 2 شبکه بتواند با نتایج خوبی همراه باشد، اما قبل از آن در ادامه به بهینه‌سازی شبکه CNN با الگوریتم‌های متنوع بهینه‌سازی پرداخته می‌شود تا مناسب‌ترین شبکه CNN را برای دستیابی به نتیجه بهتر با سیستم تطبیقی استنتاج عصبی فازی تلفیق شود.
تصاویرهای 9-ج، 9-د و 9-ه دربرگیرنده نتایج حاصل از طبقه‌بند مبتنی بر شبکه CNN می‌باشند که به‌ترتیب با استفاده از الگوریتم‌های GA، PSO و وال ابرپارامترهای آن بهینه‌سازی شده است.
با ارزیابی نتایج حاصله در حالات مختلف بهینه‌سازی شبکه CNN و بدون بهینه‌سازی آن، می‌توان دریافت که ایده مورداستفاده درزمینه بهینه‌سازی ابرپارامترها با کمک الگوریتم‌های تکاملی مؤثر واقع شده است و بهبود چشمگیری در درصد صحت به‌دست‌آمده حاصل شده است.
با مقایسه تصاویر 9-ج، 9-د , 9-ه می‌توان دریافت که الگوریتم بهینه‌سازی وال نسبت به دو الگوریتم PSO و GA عملکرد بهتری از خود در بهینه‌سازی ابر پارامترهای CNN نشان داده که درنهایت به نتیجه بهتری منجر شده است.
با مقایسه نتایج حاصل از تصاویر 9-ب و 9-ه نیز می‌توان ملاحظه کرد که همچنان استفاده از الگوریتم سیستم تطبیقی استنتاج عصبی فازی شناخت خوبی در تشخیص موارد ناهنجاری درپی داشته است، درحالی‌که CNN در تشخیص الگوهای پیچیده در داده‌های هنجار موفق‌تر عمل کرده است. درنتیجه پیش‌بینی می‌شود تلفیق این دو ابزار امکان تشخیص ناهنجاری را در کنار رویدادهای هنجار با دقت خوبی فراهم آورد. درنهایت با مشخص شدن عملکرد بهتر الگوریتم وال و بهره‌گیری از آن در بهینه‌سازی ابرپارامترها و تلفیق آن با سیستم تطبیقی استنتاج عصبی فازی نتایج حاصل این حالت نهایی، در تصویر شماره 9-و قابل‌مشاهده است.
نتایج حاصل در تصویر شماره 9-و حاکی از صحت فرضیه در نظر گرفته‌شده برای کارآمد بودن این حالت نهایی است. بااین‌حال برای ارزیابی کامل‌تر روش پیشنهادی روش F-RCNN که در پژوهش [10] پیشنهاد شده است نیز بر روی مجموعه دادگان پیاده‌سازی شده که حاصل اعمال آن و عملکردش روی مجموعه داده‌های فوق به‌صورت تصویر شماره 9-ز خواهد بود. همان‌طورکه در تصویر 9-ز مشهود است، این روش عملکرد ضعیف‌تری نسبت به روش پیشنهادی دارد.
برای ارزیابی بهتر روش پیشنهادی، علاوه‌بر فرایند فوق از روش ارزیابی متقابل 10 بخشی نیز استفاده شد. در این رویکرد، نخست کل داده‌ها به 10 بخش که در هر قسمت به تعدادی یکسان داده از هر کلاس وجود داشت، تقسیم شد. سپس از 9 بخش برای آموزش سیستم به کیفیتی که در بخش پیشین ارائه شد، استفاده و از 1 بخش برای آزمودن آن بهره گرفته شد. این فرایند تا زمانی که تمام داده‌ها در فرایند آموزش و آزمایش حضور داشته باشند، ادامه یافت. درصد صحت به‌دست‌آمده از این رویکرد به‌صورت میانگین برای 10 بار اجرا برابر با 94/28 درصد به دست آمد که با نتایج قبلی سازگار است.
با ارزیابی نتایج حاصل از تمامی شکل‌ها و نتایج ‌فوق می‌توان دریافت که روش پیشنهادی امکان تشخیص ناهنجاری را در کنار رویدادهای هنجار با دقت خوبی درپی داشته است، به‌عبارت‌دیگر می‌تواند نتایج حاصل از شبیه‌سازی صورت‌گرفته را سندی بر عملکرد خوب روش پیشنهادی و جوابگو بودن ایده پیشنهادی در فرایند تشخیص ناهنجاری دانست.

نتیجه‌گیری
در این مقاله، روشی نوین در جهت تشخیص ناهنجاری در مسیر ثبت‌شده توسط حس‌گر GPS تلفن همراه برای مراقبت از سالمندان ارائه شده است. روش پیشنهادی بر پایه بهره‌گیری از 2طبقه‌بند شبکه‌های عصبی عمیق کانولوشنی بهینه‌سازی‌شده و شبکه سیستم تطبیقی استنتاج عصبی فازی استوار است.
یکی از نوآوری‌های مطرح‌شده در این مقاله بهره‌گیری از الگوریتم بهینه‌سازی وال برای دستیابی به ساختار مناسب شبکه عصبی کانولوشنی با تعیین بهترین مقدار برای ابرپارامترهای نرخ آموزش اولیه، نرخ مومنتوم و نرخ متعادل‌سازی مربوط به آن است.
در این مقاله نشان داده شد، درنهایت این فرایند بهینه‌سازی به یک ساختار کارآمد منتهی خواهد شد و دستیابی به صحت 95/5 درصد در قیاس با صحت 77/3 درصد روی ‌داده‌های آزمایشی برای حالت بدون بهینه‌سازی و صحت 81/8 درصد برای روش رقیب نیز خود گواهی بر عملکرد مطلوب روش است.
درنهایت در تشریح بیشتر یافته‌های این پژوهش می‌توان اظهار کرد که با ارزیابی نتایج حاصل از تمامی شکل‌ها و نتایج فوق می‌توان دریافت که روش پیشنهادی امکان تشخیص ناهنجاری را در کنار رویدادهای هنجار با دقت خوبی درپی داشته است. به‌عبارت‌دیگر می‌تواند نتایج حاصل از شبیه‌سازی صورت‌گرفته را سندی بر عملکرد خوب روش پیشنهادی و جوابگو بودن ایده پیشنهادی در فرایند تشخیص ناهنجاری دانست.

ملاحظات اخلاقی
پیروی از اصول اخلاق پژوهش
در این مقاله هیچ نمونه انسانی و حیوانی ندارد و ملاحظات اخلاقی وجود نداشته است تا ضرورت رعایت در این تحقیق در نظر گرفته شود.

حامی مالی
این مقاله برگرفته از پایان‌نامه مجتبی بنی‌فخر با راهنمایی دکتر محمدتقی صادقی گروه برق دانشگاه یزد می‌باشد.

مشارکت نویسندگان
تمام نویسندگان در آماده‌سازی این مقاله مشارکت داشتند..

تعارض منافع
بنابر اظهار نویسندگان، این مقاله تعارض منافع ندارد.

تشکر و قدردانی
از مرکز محاسبات نرم و پردازش هوشمند اطلاعات در دانشگاه فردوسی مشهد به‌دلیل پشتیبانی سخت‌افزاری از این تحقیق قدردانی می‌شود.

References

Lin Q, Zhang D, Connelly K, Ni H, Yu Z, Zhou X. Disorientation detection by mining GPS trajectories for cognitively-impaired elders. Pervasive and Mobile Computing. 2015; 19:71-85. [DOI:10.1016/j.pmcj.2014.01.003]
Zhao J, Yi Z, Pan S, Zhao Y, Zhao Z, Su F, et al. Unsupervised traffic anomaly detection using trajectories. Paper presented at: 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 20 June 2019; Long Beach, California. [Link]
Angermueller C, Pärnamaa T, Parts L, Stegle O. Deep learning for computational biology. Molecular Systems Biology. 2016; 12(7):878. [DOI:10.15252/msb.20156651] [PMID] [PMCID]
Amodei D, Ananthanarayanan S, Anubhai R, Bai J, Battenberg E, Case C, et al. Deep speech 2: End-to-end speech recognition in english and mandarin. Paper presented at: Proceedings of The 33^rd International Conference on Machine Learning. 11 June 2016; New York, US. [Link]
Witten IH, Frank E. Data mining: Practical machine learning tools and techniques with Java implementations. ACM SIGMOD Record. 2002; 31(1):76-7. [DOI:10.1145/507338.507355]
LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015; 521(7553):436-44. [DOI:10.1038/nature14539] [PMID]
Žunić E, Delalić S, Hodžić K, Tucaković Innovative GPS data anomaly detection algorithm inspired by qrs complex detection algorithms in ECG signals. Paper presented at: IEEE EUROCON 2019 -18^th International Conference on Smart Technologies. 1 July 2019; Novi Sad, Serbia. [DOI:10.1109/EUROCON.2019.8861619]
Barucija E, Mujcinovic A, Muhovic B, Zunic E, Donko D. Data-driven approach for anomaly detection of real GPS trajectory data. Paper presented at: 2019 XXVII International Conference on Information, Communication and Automation Technologies (ICAT). 20 October 2019; Sarajevo, Bosnia and Herzegovina. [DOI:10.1109/ICAT47117.2019.8938938]
Dabiri S, Heaslip K. Inferring transportation modes from GPS trajectories using a convolutional neural network. Transportation Research Part C: Emerging Technologies. 2018; 86:360-71. [DOI:10.1016/j.trc.2017.11.021]
Shine L, Edison A, Jiji CV. A comparative study of faster R-CNN models for anomaly detection in 2019 AI city challenge. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. 2019; 306- [Link]
Davis N, Raina G, Jagannathan K. A framework for end-to-end deep learning-based anomaly detection in transportation networks. Transportation Research Interdisciplinary Perspectives. 2020; 5:100112. [DOI:10.1016/j.trip.2020.100112]
Mirjalili S, Lewis A. The whale optimization algorithm. Advances in Engineering Software. 2016; 95:51-67. [DOI:10.1016/j.advengsoft.2016.01.008]
Jang JSR. ANFIS: Adaptive-network-based fuzzy inference system.IEEE Transactions on Systems, Man, and Cyberneti 1993; 23(3):665-85. [DOI:10.1109/21.256541]

References

Lin Q, Zhang D, Connelly K, Ni H, Yu Z, Zhou X. Disorientation detection by mining GPS trajectories for cognitively-impaired elders. Pervasive and Mobile Computing. 2015; 19:71-85. [DOI:10.1016/j.pmcj.2014.01.003]
Zhao J, Yi Z, Pan S, Zhao Y, Zhao Z, Su F, et al. Unsupervised traffic anomaly detection using trajectories. Paper presented at: 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 20 June 2019; Long Beach, California. [Link]
Angermueller C, Pärnamaa T, Parts L, Stegle O. Deep learning for computational biology. Molecular Systems Biology. 2016; 12(7):878. [DOI:10.15252/msb.20156651] [PMID] [PMCID]
Amodei D, Ananthanarayanan S, Anubhai R, Bai J, Battenberg E, Case C, et al. Deep speech 2: End-to-end speech recognition in english and mandarin. Paper presented at: Proceedings of The 33^rd International Conference on Machine Learning. 11 June 2016; New York, US. [Link]
Witten IH, Frank E. Data mining: Practical machine learning tools and techniques with Java implementations. ACM SIGMOD Record. 2002; 31(1):76-7. [DOI:10.1145/507338.507355]
LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015; 521(7553):436-44. [DOI:10.1038/nature14539] [PMID]
Žunić E, Delalić S, Hodžić K, Tucaković Innovative GPS data anomaly detection algorithm inspired by qrs complex detection algorithms in ECG signals. Paper presented at: IEEE EUROCON 2019 -18^th International Conference on Smart Technologies. 1 July 2019; Novi Sad, Serbia. [DOI:10.1109/EUROCON.2019.8861619]
Barucija E, Mujcinovic A, Muhovic B, Zunic E, Donko D. Data-driven approach for anomaly detection of real GPS trajectory data. Paper presented at: 2019 XXVII International Conference on Information, Communication and Automation Technologies (ICAT). 20 October 2019; Sarajevo, Bosnia and Herzegovina. [DOI:10.1109/ICAT47117.2019.8938938]
Dabiri S, Heaslip K. Inferring transportation modes from GPS trajectories using a convolutional neural network. Transportation Research Part C: Emerging Technologies. 2018; 86:360-71. [DOI:10.1016/j.trc.2017.11.021]
Shine L, Edison A, Jiji CV. A comparative study of faster R-CNN models for anomaly detection in 2019 AI city challenge. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. 2019; 306- [Link]
Davis N, Raina G, Jagannathan K. A framework for end-to-end deep learning-based anomaly detection in transportation networks. Transportation Research Interdisciplinary Perspectives. 2020; 5:100112. [DOI:10.1016/j.trip.2020.100112]
Mirjalili S, Lewis A. The whale optimization algorithm. Advances in Engineering Software. 2016; 95:51-67. [DOI:10.1016/j.advengsoft.2016.01.008]
Jang JSR. ANFIS: Adaptive-network-based fuzzy inference system.IEEE Transactions on Systems, Man, and Cyberneti 1993; 23(3):665-85. [DOI:10.1109/21.256541]

The Scientific Journal of Rehabilitation Medicine

Proposing a Method for Anomaly Detection in Trajectory of Patients With Alzheimer’s Disease Using Mobile GPS Data and Combination of Deep Neural Network and Adaptive Neuro-fuzzy Inference System

Full Text

References

Volume 12, Issue 2
May and June 2023
Pages 274-291

Files

History

Share

How to cite

Statistics

Volume 12, Issue 2May and June 2023Pages 274-291

Volume 12, Issue 2
May and June 2023
Pages 274-291