Document Type : Original article
Authors
1 Department of Sports Biomechanics, Faculty of Sports Sciences, University of Mazandaran, Babolsar, Iran.
2 Department of Computer Sciences, Faculty of Mathematical Sciences, University of Mazandaran, Babolsar, Iran.
Abstract
Keywords
Main Subjects
Introduction
Running has become one of the most popular exercises due to its accessibility and low cost. However, the repetitive nature of running leads to a high incidence of overuse injuries. Epidemiological studies have reported an annual running-related injury rate of 19-79%, with 70% of cases involving the knee and lower limbs. Despite widespread preventive interventions, injury prevalence has not significantly decreased in recent decades, probably due to individual variability in response to treatments. This suggests that identifying homogeneous movement patterns and developing personalized interventions can be an effective strategy for injury prevention. While traditional clustering algorithms have been used to cluster runners with homogeneous movement patterns, their effectiveness is limited by challenges in processing biomechanical time-series data and capturing nonlinear movement features. Recent advances in deep temporal clustering (DTC) algorithms, utilizing deep autoencoders, have demonstrated superior capability in extracting complex temporal patterns and identifying homogeneous movement groups [7] also known as temporal clustering, is a challenging problem in machine learning. Here we propose a novel algorithm, DTC. This study aims to compare the performance of the DTC algorithm and conventional methods, including principal component analysis (PCA)-based K-means clustering and hierarchical clustering, for analyzing runners’ ankle kinematic data. We hypothesize that the DTC algorithm has greater accuracy due to its ability to model nonlinear relationships and preserve temporal dependencies in movement data.
Methods
The study examined 108 recreational runners (Mean age: 22.45±2.42 years) using motion capture systems to analyze their ankle kinematics during running at a speed of 3.0±3 meters per second. Ankle kinematics were transformed into 101-point stance phase matrices for DTC and were reduced to 12 principal components for traditional clustering methods. Three clustering methods were utilized: 1) DTC algorithm employing a one-dimensional-convolutional neural network (1D-CNN) and a bidirectional long short-term memory (Bi-LSTM) model to extract temporal features and cluster data in latent space; 2) Hierarchical clustering with Ward’s linkage on PCA-reduced data; and 3) K-means clustering (k=2-8), optimized using the Calinski-Harabasz index (CHI). The cluster validity metrics included Silhouette score for cluster cohesion and Davies-Bouldin index (DBI) for inter-cluster separation; higher Silhouette scores (up to 1) and lower Davies-Bouldin values indicate better clustering performance. The DTC architecture was specifically designed to address limitations of convolutional methods in processing biomechanical time-series data through its temporal autoencoder design (Figure 1).
Results
The results showed that the DTC algorithm achieved superior cluster separation with a silhouette score of 0.74 and DBI value of 0.35, despite requiring a longer execution time (20 seconds). The DTC algorithm also showed the lowest clustering inconsistency rate (6%) and successfully identified three distinct clusters. Hierarchical clustering yielded a silhouette score of 0.68 and DBI value of 0.52, with an execution time of 10 seconds and a clustering inconsistency rate of 15%, and was able to identify three clusters. In contrast, the K-means method emerged as the fastest algorithm with an execution time of only 3 seconds, but showed relatively poorer clustering quality (silhouette score: 0.63; DBI: 0.78) and a higher clustering inconsistency rate (18%). The comparative analysis highlighted DTC’s superior performance in capturing meaningful movement patterns despite its greater computational time (Table 1).
Conclusion
There are significant differences in performance between hierarchical, K-means, and DTC algorithms in analyzing 3D ankle joint kinematics during running. DTC has superior clustering quality despite a longer execution time. Its integrated dimensionality reduction and clustering architecture, featuring an autoencoder and specialized clustering layer, has a lower clustering inconsistency rate and can effectively capture complex movement patterns. These results confirm DTC’s advantages over conventional clustering methods for movement pattern analysis. Conventional algorithms showed limitations primarily due to PCA-based dimensionality reduction, which eliminates nonlinear relationships in movement data. While PCA scaling is common, it alters data structure and complicates biomechanical interpretation. The DTC algorithm overcame these limitations by processing complete stance phase data without dimensionality reduction, preserving subtle movement variations. The DTC’s end-to-end unsupervised learning framework provides researchers with an improved tool for precise movement pattern analysis. Unlike traditional methods that may produce ambiguous results, DTC maintains data integrity while enabling meaningful clinical interpretation. This has particular promise for developing targeted interventions in running biomechanics, though additional validation studies are warranted to establish its clinical utility across diverse populations and movement conditions.
Ethical Considerations
Compliance with ethical guidelines
This study was approved by the Ethics Committee of the University of Mazandaran, Babolsar, Iran (Code: IR.UMZ.REC.1403.097). All ethical principles were considered in this study. The participants were informed about the research objectives and methods. They were also assured of the confidentiality of their information and were free to leave the study at any time, and if desired, the research results would be available to them.
Funding
This study was extracted from the dissertation of Zaniar Mohamadi at the Department of Sports Biomechanics, University of Mazandaran. This research did not receive any specific grant from funding agencies in the public, commercial, or not-for profit sectors.
Authors' contributions
All authors contributed equally to the conception and design of the study, data collection and analysis, interpretation of the results, and drafting of the manuscript. Each author approved the final version of the manuscript for submission.
Conflict of interest
The authors declared no conflict of interest.
Acknowledgments
The authors would like to thank all the patients who participated in this study for their cooperation.
مقدمه و اهداف
دویدن به دلیل دسترسی آسان و هزینههای پایین، یکی از رایجترین فعالیتهای ورزشی محسوب میشود و در میان عموم مردم محبوبیت زیادی یافته است [1]. بااینحال با افزایش مشارکت و به دلیل ماهیت تکراری این فعالیت، بروز آسیبهای ناشی از پرکاری در میان دوندگان رایج شده است [2، 3]. براساس مطالعات اپیدمیولوژیک نرخ بروز آسیبهای مرتبط با دویدن بین 19 تا 79 درصد در سال بوده که 70 درصد در زانو و بخشهای تحتانی زانو گزارش شده است [4]. با وجود استفاده گسترده از مداخلات پیشگیرانه و درمانی، شیوع آسیبهای ناشی از دویدن طی دهههای اخیر کاهش معناداری نداشته است [5]. این نتایج ممکن است ناشی از تفاوتهای فردی در پاسخ به مداخلات پیشگیرانه از قبیل کفشهای مخصوص دویدن باشد. برایناساس، شناسایی الگوهای حرکتی در گروههای همگن و طراحی مداخلات متناسب میتواند به تدوین دستورالعملهای مؤثرتر درمانی یا پیشگیرانه کمک کند [5].
اخیراً با استفاده از الگوریتمهای خوشهبندی بدون نظارت، مطالعاتی جهت شناسایی خوشههایی از دوندگان با الگوی حرکتی همگن انجام شده است [6، 7، 9]. اگرچه الگوریتمهای خوشهبندی سنتی در برخی مطالعات به کار رفتهاند، اما این روشها اغلب برای دادههای استاتیک با ابعاد کم طراحی شدهاند و با دادههای سریزمانی سازگاری مناسبی ندارند [10، 11]. بنابراین، استفاده از این الگوریتمها برای پردازش دادههای بیومکانیکی با چالش بزرگی ابعاد دادهها مواجه است [11]. جهت رفع این چالش، معمولاً از روش تحلیل مؤلفههای اصلی استفاده میشود [12]. به این ترتیب که مجموعهای از مؤلفههای اصلی که دربرگیرنده 70 تا 80 درصد از واریانس کل دادهها است، بهعنوان ورودی الگوریتم استفاده میشود. بااینحال این روش با مشکلاتی نظیر نادیده گرفتن تفاوتهای ظریف در الگوی حرکتی مواجه است [12]. برای مثال در یک پژوهش که گروهبندی عملکردی براساس سینماتیک پا و مچ پا در حین دویدن صورت گرفت، مقادیر پایین شاخص سیلوئت (0/13) و ضریب همبستگی کوفنتیک (0/38) نشاندهنده ناهمگنی گروههای شناساییشده بود [6]. بهطورکلی، ناتوانی روشهای اخیر در گروهبندی عملکردی را میتوان ناشی از محدودیتهایی از قبیل نادیده گرفتن پیوستگی زمانی [13]، مقیاسبندی مجدد دادهها جهت تفسیر [5]، نادیدهگرفتن روابط غیرخطی بین متغیرها [14]، وابستگی به محورهای انتخابشده و همچنین محدود بودن معیارهای سنجش شباهت میان الگوها دانست [14].
برای غلبه بر این محدودیتها، استفاده از الگوریتمهای یادگیری عمیق، بهویژه خوشهبندی زمانی عمیق، پیشنهاد شده است [8]. مزیت اصلی این الگوریتم، استفاده از ساختار خودرمزنگار عمیق است که قادر به نگاشت اطلاعات غیرخطی و استخراج ویژگیهای پیچیده سریزمانی در یک فضای پنهان است. پس از نگاشت دادهها به فضای پنهان، لایه خوشهبندی زمانی با استفاده از معیارهای متنوع برای اندازهگیری شباهت یا عدم شباهت، امکان شناسایی الگوهای حرکتی گروههای همگن را فراهم میکند که متناسب با نیاز و کاربرد قابلتنظیم است [8]علاوهبراین، این الگوریتم توانایی شناسایی موضعی رویدادها در دادههای سریزمانی بدون برچسب را دارد و برخلاف رویکردهای جعبهسیاه، اطلاعاتی درباره مؤثرترین ویژگیها در فرایند خوشهبندی ارائه میدهد .در یک تحقیق که روش خوشهبندی مبتنی بر نگاشت سرتاسری دادهها ، با روشهای خوشهبندی مبتنی بر یادگیری ماشین مقایسه شد، نتایج نشان داد روش سرتاسری با میانگین نمودار مشخصه عملکرد 0/92 نسبت به روشهای خوشهبندی مبتنی بر یادگیری ماشین با میانگین نمودار مشخصه عملکرد 0/88 برتری دارد [8]. الگوریتم خوشهبندی زمانی عمیق در 13 مجموعه داده سریزمانی متشکل از دادههایی با تعداد نمونه، توالی زمانی و نسبت توزیع خوشه گوناگون بهطورکلی عملکرد بهتری نسبت به روشهای خوشهبندی مبتنی بر یادگیری ماشین داشته است .
بااینحال، بیشتر تحقیقات انجامشده در این زمینه بر دادههای مربوط به حوزههای هوافضا و محیط زیست متمرکز بودهاند. ازآنجاکه دادههای بیومکانیکی نیز ماهیت سریزمانی دارند و ویژگیهای ویسکوالاستیسیته بافتهای بدن انسان دارای خصوصیات منحصربهفردی هستند، بررسی کارایی این روشها بر روی دادههای بیومکانیکی ضروری به نظر میرسد [15]. بهمنظور اطمینان از عملکرد بهینه این روشها بر روی دادههای بیومکانیکی، انجام تحلیل مقایسهای بین روشهای مختلف خوشهبندی پیشنهاد میشود [11]. براساس مرور منابع موجود، تاکنون هیچ مطالعهای بهطور تجربی عملکرد الگوریتمهای مذکور را در تحلیل دادههای بیومکانیکی دوندگان بررسی نکرده است.
هدف مطالعه حاضر، مقایسه عملکرد الگوریتمهای خوشهبندی سلسلهمراتبی و K-means مبتنی بر تحلیل مؤلفههای اصلی با الگوریتم خوشهبندی عمیق زمانی مبتنی بر نگاشت سرتاسری دادهها جهت شناسایی گروههای همگن دوندهها بود. این مطالعه میکوشد به بررسی اثربخشی روشهای مختلف خوشهبندی یادگیری عمیق در تحلیل دادههای سریزمانی جهت شناسایی گروههای دوندگان با الگوی حرکتی مشابه بپردازد. فرضیات تحقیق:
1. الگوریتم خوشهبندی عمیق زمانی، به دلیل قابلیتهای پیشرفته در استخراج ویژگیهای پیچیده دادههای سریزمانی، در مقایسه با الگوریتم خوشهبندی K-means مبتنی بر تحلیل مؤلفههای اصلی، عملکرد و دقت بیشتری دارد.
2. الگوریتم خوشهبندی عمیق زمانی، به دلیل بهرهگیری از ساختار خودرمزنگار عمیق و توانایی در مدلسازی الگوهای غیرخطی، در مقایسه با الگوریتم خوشهبندی سلسلهمراتبی مبتنی بر تحلیل مؤلفههای اصلی، دقت و کارایی بالاتری ارائه میدهد.
مواد و روشها
108 دونده سالم تفریحی (سن: 2/42±22/45 سال، قد: 0/11±1/69 متر، جرم بدن: 9/54±64/64 کیلوگرم، جنسیت: 55 مرد، 53 زن) وارد مطالعه شدند. معیارهای ورود: نداشتن سابقه جراحی، شکستگی، سوختگی، مشکلات عصبیعضلانی، آسیبهای حاد یا آسیبهای ناشی از دویدن، نداشتن ضربات جدی در اندام تحتانی و عدم استفاده از اندام مصنوعی در ران، زانو و مچ پا، نداشتن ناهنجاریهای ساختاری و عملکردی، مانند گودی کمر، صافی کمر، کف پای صاف و گود و همچنین زانوی ضربدری و پرانتزی، عدم استفاده از هرگونه کفی، نداشتن دیابت و بیماریهای مربوط به اعصاب پیرامونی در 6 ماه قبل از آزمون و نداشتن هیچگونه دردی در 3 ماه قبل از آزمون. اطلاعات مربوط به تست غربالگری توسط فیزیوتراپ متخصص کنترل شد.
یک صفحه نیروی Kistler (سوئیس) با فرکانس نمونهبرداری 1000 هرتز در مرکز مسیر 15 متری نصب شد. برای کنترل سرعت، زمان طی شدن فاصله 5 متری از نقطه شروع تا برخورد با صفحه نیرو توسط 2 ارزیاب مستقل بهصورت همزمان و با استفاده از کرنومتر دیجیتال Q&Q-VQ47 (ژاپن) با دقت 0/01 ثانیه اندازهگیری شد. معیارهای پذیرش : 1. اختلاف زمانی کمتر از 0/05 ثانیه بین اندازهگیریهای 2 ارزیاب؛ 2. سرعت در بازه 2/7 تا 3/3 متر بر ثانیه (متر بر پانیه 0/3±3). تحلیل قابلیت اطمینان، مقادیر خطای استاندارد اندازهگیری (متر بر ثانیه 0/11=SEM) و حداقل تغییر قابلتشخیص (متر بر ثانیه 0/3=95 درصد MDC) را نشان داد که بیانگر دقت مناسب روش اندازهگیری برای اهداف مطالعه بود. در این تحقیق، از مدل سینماتیکی دو بخشی برای مدلسازی ساق پا و پا بهعنوان اجسام صلب بهرهگیری شد که منطبق بر مدلهای استاندارد 6 درجه آزادی است و بهویژه در مطالعات مرتبط با دویدن رایج است [16]. 7 نشانگر بازتابی بر روی برجستگیهای استخوانی اپیکوندیلهای داخلی و خارجی ران، قوزکهای داخلی و خارجی، مرکز استخوان پاشنه در محل اتصال تاندون آشیل، انتهای دیستال استخوانهای متاتارس 1 و 5 و همچنین پایه استخوان متاتارس دوم قرار داده شدند. همچنین یک کلاستر شامل 3 نشانگر روی ساق، بهعنوان نشانگرهای آناتومیک و رهگیری استفاده شد (تصویر شماره 1).
دادههای سینماتیکی با استفاده از 6 دستگاه دوربین فیلمبرداری شرکت Simi Motion ساخت آلمان با سرعت تصویربرداری 200 هرتز جمعآوری شدند. برای هر آزمودنی 3 تلاش موفق ثبت شد. مرحله استقرار دویدن با استفاده از نیروی عمودی عکسالعمل زمین که حاصل از صفحه نیروسنج بود تعیین شد. دادههای خام با استفاده از پالایه پایینگذر باترورث مرتبه چهارم در فرکانس برشی 16 هرتز (تعیینشده براساس روش تحلیل باقیمانده) پالایه شد (تصویر شماره 2) [15].
با استفاده از مختصات، زوایای سهبعدی مفصل مچ پا به روش توالی (XYZ) کاردان در محیط نرمافزار متلب نسخه 2022 محاسبه و دادهها ازنظر زمانی به 100 درصد مرحله استقرار دویدن هنجار شد [15]. درنهایت برای هر آزمودنی یک ماتریس به ابعاد 101×3 تشکیل (جدول شماره 1) و بهعنوان ورودی الگوریتم خوشهبندی به نرمافزار پایتون منتقل شد.
ماتریس داده
برای الگوریتم خوشهبندی زمانی عمیق، دادههای هر آزمودنی در قالب ماتریسی با ابعاد 101×3 سازماندهی شد که سه ستون آن نمایانگر زوایای مفصل مچ پا در سه صفحه حرکتی (سهمی، عرضی و افقی) و 101 ردیف آن متناظر با 101 درصد مرحله استقرار دویدن بود. درنتیجه 108 ماتریس مجزا به دست آمد. این دادهها در فایلهای اکسل ذخیره و بهعنوان ورودی الگوریتم عمیق زمانی(DTC) به کار گرفته شدند (جدول شماره 1). بهمنظور استفاده در الگوریتمهای K-means و سلسلهمراتبی، دادهها بهصورت یک ماتریس 303×108 (تعداد ویژگی × تعداد آزمودنی) ادغام شدند. سپس با بهرهگیری از تحلیل مؤلفههای اصلی (PCA)، مؤلفههایی انتخاب شدند که درمجموع حداقل 95 درصد از واریانس دادهها را پوشش میدادند [12]. درنهایت، 12 مؤلفه اصلی استخراج و در قالب ماتریسی با ابعاد 12×108 به الگوریتمهای خوشهبندی کلاسیک منتقل شدند (جدول شماره 2).
الگوریتم خوشهبندی عمیق زمانی
در محیط نرمافزار پایتون نسخه 3/8 الگوریتم خوشهبندی عمیق زمانی با هدف خوشهبندی الگوهای سینماتیک اجرا شد. این الگوریتم در 3 مرحله پیادهسازی شد.
در مرحله اول، یک شبکه عصبی پیچشی یکبعدی (1D-CNN) برای استخراج ویژگیهای محلی از دادههای سریزمانی به کار گرفته شد.
مرحله دوم شامل استفاده از شبکه حافظه کوتاهمدت ـ بلندمدت دوطرفه برای مدلسازی روابط زمانی میان مقاطع مختلف داده بود.
در مرحله سوم، با بهرهگیری از نمایش نهفته تولیدشده، خوشهبندی ناپارامتری در فضای زمانیمکانی انجام شد که منجر به شناسایی خوشههای حرکتی همگن شد (تصویر شماره 3).
الگوریتم خوشهبندی سلسلهمراتبی: بهمنظور شناسایی الگوهای همگن در زوایای سهبعدی مفصل مچ پا، از الگوریتم خوشهبندی سلسلهمراتبی مبتنی بر مؤلفههای اصلی استفاده شد [17، 18]. این رویکرد شامل 3 مرحله اصلی بود (تصویر شماره 4): محاسبه ماتریس فاصله بین آزمودنیها براساس مؤلفههای اصلی استخراجشده؛ ادغام تدریجی خوشهها با استفاده از روش پیوند و ساخت دندروگرام و تعیین تعداد خوشهها با ارزیابی دندروگرام و استفاده از آستانه ناسازگاری که مقادیر بالاتر آن نشاندهنده تمایز بهتر خوشهها هستند [17].
الگوریتم خوشهبندی K-means: الگوریتم K-means یکی از روشهای خوشهبندی بدون نظارت است که هدف آن گروهبندی نمونهها براساس الگوهای نهفته در دادههاست [19]. در این الگوریتم، ابتدا تعداد خوشهها (k) بهصورت پیشفرض یا برپایه تحلیلهای آماری مشخص میشود. سپس مراکز اولیه خوشهها بهصورت تصادفی انتخاب شده و هر نمونه براساس کمترین فاصله اقلیدسی به نزدیکترین مرکز اختصاص مییابد [19، 20]. پس از تخصیص اولیه، مراکز خوشهها با میانگینگیری از نقاط منتسب به هر خوشه بهروزرسانی میشوند و این فرایند بهصورت تکراری تا همگرایی الگوریتم ادامه مییابد (تصویر شماره 5).
باتوجهبه وابستگی الگوریتم K-means به مقداردهی اولیه مراکز خوشهها و احتمال قرارگیری در بهینههای موضعی (بدون دستیابی به بهینه سراسری)، تعیین مقدار بهینه پارامتر k از اهمیت ویژهای برخوردار است [20]. در این مطالعه، با استناد به پیشینه پژوهشهای بیومکانیکی که بازه 2 تا 8 خوشه را مناسب میدانند، الگوریتم در این بازه برای مقادیر مختلف k اجرا شد. سپس، کیفیت هر مدل با استفاده از شاخص کالنسکی ـ هارباز ارزیابی شد تا مناسبترین تعداد خوشه شناسایی شود [20، 21].
معیار ارزیابی: برای ارزیابی عملکرد الگوریتمهای خوشهبندی، از 3 شاخص رایج شامل ضریب سیلوئت، شاخص دیویس ـ بولدین و شاخص کالینسکی ـ هاراباز استفاده شد [22]. ضریب سیلوئت میزان شباهت هر نمونه را به خوشه خود، نسبت به نزدیکترین خوشه دیگر میسنجد. مقادیر نزدیک به 1 نشاندهنده کیفیت بالای خوشهبندی، مقادیر نزدیک به صفر نشانهی مرزی بودن نمونهها و مقادیر منفی بیانگر تخصیص نادرست هستند. شاخص دیویس ـ بولدین نیز با بررسی نسبت میانگین فشردگی درون خوشه به فاصله بین خوشهها، عملکرد الگوریتم را ارزیابی میکند. مقادیر پایینتر نشاندهنده کیفیت بالاتر خوشهبندی هستند [22]. شاخص کالینسکی ـ هاراباز با محاسبه نسبت واریانس بینخوشهای به درونخوشهای، معیار کمّی جداسازی خوشهها را ارائه میدهد. مقادیر بالاتر نشاندهنده ساختار خوشهای قویتر هستند.
یافتهها
این مطالعه به مقایسه عملکرد 3 الگوریتم خوشهبندی سلسلهمراتبی، K-means و خوشهبندی عمیق زمانی در تحلیل دادههای سینماتیکی سهبعدی مفصل مچ پای دوندگان پرداخته است. نتایج نشان میدهد خوشهبندی عمیق زمانی با نمره سیلوئت 0/74 و نمره 0/35 در شاخص دیویس ـ بولدین عملکرد مطلوبی در تفکیک خوشهها به ثبت رسانده است. هرچند زمان اجرای آن 20 ثانیه بود. همچنین این الگوریتم کمترین نرخ ناسازگاری (6 درصد) را نشان داد و موفق به شناسایی 3 خوشه مجزا شد. خوشهبندی سلسلهمراتبی نیز نمره سیلوئت 0/68 و نمره 0/52 در شاخص دیویس ـ بولدین را به همراه زمان اجرای 10 ثانیه و نرخ ناسازگاری 15 درصد به دست آورد، درحالیکه تعداد خوشههای آن نیز 3 بود. در مقابل K-means با نمره سیلوئت 0/63 و نمره 0/78 در شاخص دیویس ـ بولدین، بهعنوان سریعترین الگوریتم شناخته شد و تنها 3 ثانیه برای اجرا نیاز داشت، اما با نرخ ناسازگاری 18 درصد و مقادیر پایینتر شاخصهای ارزیابی کیفیت خوشهبندی، در مقایسه با دیگر روشها، ازنظر کیفیت خوشهبندی چندان قابلتوجه نبوده است. همچنین جدول شماره 3 شامل نتایج اجرای هریک از الگوریتمهای خوشهبندی به همراه شاخصهای سیلوئت، زمان اجرا، نرخ ناسازگاری و دیگر موارد مرتبط است (جدول شماره 3).
بحث
این مطالعه به مقایسه عملکرد 3 الگوریتم خوشهبندی سلسلهمراتبی، K-means و خوشهبندی عمیق زمانی در تحلیل دادههای سینماتیکی سهبعدی مفصل مچ پای دوندگان پرداخته است. ارزیابی عملکرد الگوریتمها با استفاده از شاخصهای سیلوئت، شاخص دیویس ـ بولدین و شاخص کالینسکی ـ هاراباز همراه با بررسی زمان اجرا و نرخ ناسازگاری انجام شد. یافتهها تفاوتهای معناداری در عملکرد این الگوریتمها نشان داد آنها میتوانند مبنای مناسبی برای انتخاب الگوریتم بهینه در خوشهبندی الگوهای حرکتی باشند.
نتایج پژوهش نشاندهنده برتری عملکرد الگوریتم خوشهبندی عمیق زمانی با شاخص سیلوئت 0/74 و شاخص کالینسکی ـ هاراباز 150 نسبت به 2 الگوریتم دیگر بود. این الگوریتم که از یک رمزگذار خودکار برای کاهش ابعاد و لایههای تخصصی خوشهبندی استفاده میکند. با وجود زمان اجرای 20 ثانیهای، نرخ ناسازگاری پایینی (6 درصد) نشان داد (جدول شماره 3). این عملکرد مطلوب ناشی از یکپارچهسازی بهینه فرایندهای کاهش ابعاد و خوشهبندی در معماری الگوریتم است که توانایی شناسایی الگوهای پیچیده حرکتی را فراهم میکند [8، 11، 23]
تحلیل جامع شاخصهای ارزیابی نشان میدهد الگوریتم خوشهبندی عمیق زمانی در تمامی معیارهای سنجش کیفیت خوشهبندی، نتایج بهتری نسبت به الگوریتمهای سلسلهمراتبی و K-means بهدست آورده است (جدول شماره 3). این یافتهها فرضیه برتری دقت و کارایی الگوریتم عمیق زمانی را تأیید میکند. عملکرد ضعیفتر الگوریتمهای سنتی احتمالاً به دلیل محدودیتهای ذاتی روش تحلیل مؤلفههای اصلی در پردازش دادههای پیچیده است [12]. این روش ضمن کاهش ابعاد دادهها، منجر به حذف بخشی از اطلاعات و روابط غیرخطی موجود در دادههای حرکتی میشود [12، 14] که بهطور محسوسی بر دقت شناسایی الگوهای همگن حرکتی تأثیر منفی گذاشته است [6]. بنابراین به نظر میرسد استفاده از روشهای نوین مبتنی بر یادگیری عمیق میتواند گامی مؤثر در جهت بهبود دقت و کارایی خوشهبندی الگوهای حرکتی پیچیده باشد.
استفاده از روشهای مقیاسبندی دادهها مانند تجزیهوتحلیل مؤلفههای اصلی برای هموزنسازی متغیرها در الگوریتمهای خوشهبندی سلسلهمراتبی و K-means، اگرچه رویکردی متداول در پردازش دادهها محسوب میشود، اما چالشهای مهمی را در مطالعات بیومکانیکی ایجاد میکند. این فرایند میتواند منجر به تغییر در ساختار ذاتی دادهها شده و درنتیجه تفسیر بالینی و بیومکانیکی نتایج را با مشکلات اساسی مواجه کند [6]. در مطالعات کاربردی در حوزه حرکتی، صرف شناسایی خوشهها کافی نیست و تحلیل دقیق تغییرات الگوهای حرکتی بین خوشههای مختلف اهمیت بالایی دارد [24]. بهویژه در تحلیلهای بیومکانیکی، درک زمانبندی و علل تغییرپذیری دادهها نسبت به خود فرایند گروهبندی از اولویت بالاتری برخوردار است [5، 9]. فرایند مقیاسبندی دادهها میتواند موانع جدی در شناسایی خوشههای بالینی و بیومکانیکی معنادار ایجاد کند، چالشی که بهوضوح در پژوهشهای مبتنی بر الگوریتمهای سنتی خوشهبندی مشهود است [13، 14].
الگوریتم خوشهبندی زمانی عمیق، الگوهای حرکتی همگن را شناسایی و خوشهبندی میکند. برخلاف روشهای سنتی که عموماً از تحلیل مؤلفههای اصلی بهمنظور کاهش ابعاد دادهها استفاده میکنند، این الگوریتم بهطور کامل تمامی دادههای مرحله استقرار دویدن را مدنظر قرار میدهد تا شباهت میان الگوهای حرکتی را مشخص کند [8]؛ بنابراین با لحاظ تفاوتهای ظریف الگوهای حرکتی، این الگوریتم قادر است تحلیل دقیقتری از الگوهای حرکت دویدن ارائه دهد و به خوشهبندی بهینه دست یابد [10]. همچنین ترکیب کاهش ابعاد و خوشهبندی زمانی در یک چارچوب یادگیری سرتاسری بدون نظارت، این الگوریتم را به ابزاری مؤثر برای شناسایی الگوهای حرکتی همگن تبدیل میکند [8]؛ بدین ترتیب، الگوریتم خوشهبندی عمیق زمانی، روشی بهبودیافته را برای پژوهشگران فراهم میآورد تا با دقت و کارایی بیشتر، الگوهای حرکتی را تجزیهوتحلیل و گروهبندی کنند.
نتایج مقایسه عملکرد 2 الگوریتم خوشهبندی K-means و سلسلهمراتبی در تحلیل دادههای بیومکانیکی با پیشپردازش تحلیل مؤلفههای اصلی(PCA) نشان داد. الگوریتم خوشهبندی K-means ازلحاظ سرعت پردازش (3 ثانیه) نسبت به روش سلسلهمراتبی (10 ثانیه) برتری دارد. بااینحال، ارزیابی شاخصهای کیفی، شامل نمره سیلوئت (0/68 در مقابل 0/63)، شاخص دیویس ـ بولدین (0/87 در مقابل 0/52) و نرخ ناسازگاری (15 درصد در مقابل 18 درصد) نشاندهنده عملکرد مطلوب الگوریتم سلسلهمراتبی در شناسایی الگوهای حرکتی همگن بود (جدول شماره 3). با وجود این، باید توجه داشت استفاده از PCA بهعنوان روش کاهش ابعاد، با محدودیتهایی در پردازش دادههای سریزمانی بیومکانیکی همراه است که میتواند بر تفسیر نتایج تأثیرگذار باشد [12، 13].
قبل از اجرای الگوریتمهای خوشهبندی سلسلهمراتبی و K-means، یک تحلیل مؤلفههای اصلی (PCA) بهصورت یکجا بر روی کل مجموعه دادههای سینماتیکی انجام شد. اگرچه این رویکرد به اجزای کاهشیافته اجازه میدهد تا الگوهای حرکتی را در تمام سطوح بهطور همزمان نشان دهند، ابعاد مجموعه داده را افزایش میدهد و اعتبار خارجی و پایداری PCA را محدود میکند [12، 13]. علاوهبراین تفسیر معنای عملی مؤلفهها در هر صفحه پیچیدهتر و مبهم شده و احتمال بروز نتایج متناقض را افزایش میدهد [6، 13]. در مقابل، الگوریتمهای خوشهبندی زمانی عمیق با حفظ ویژگیهای اصلی دادهها، امکان تجزیهوتحلیل دقیقتر و تفسیر معنادار بالینی را فراهم میآورند.
پژوهشهای پیشین نشان دادهاند ویژگیهای زیره میانی کفش بهطور معناداری بر پارامترهای سینماتیکی و سینتیکی [5، 25، 26] و همچنین الگوی فعالیت عضلانی [27] در حین حرکت تأثیر میگذارند. در مطالعه حاضر، خوشهبندی براساس ارزیابی دویدن در شرایط پای برهنه اجرا شد (تصویر شماره 1). این رویکرد با این فرضیه طراحی شد که الگوی حرکتی پای برهنه میتواند بهعنوان معیار پایه و نمایانگر الگوی حرکتی طبیعی شرکتکنندگان در نظر گرفته شود.
نتیجهگیری
این مطالعه به مقایسه عملکرد الگوریتمهای خوشهبندی سلسلهمراتبی و K-means مبتنی بر تحلیل مؤلفههای اصلی با الگوریتم خوشهبندی عمیق زمانی در تحلیل دادههای سینماتیکی مفصل مچ پای دوندگان پرداخته است. یافتهها نشان داد الگوریتم خوشهبندی عمیق زمانی با بهرهگیری از معماری پیشرفته مبتنی بر یادگیری عمیق، عملکرد مطلوبتری در شناسایی الگوهای پیچیده حرکتی و تفکیک خوشهها دارد. این برتری عمدتاً به دلیل توانایی این الگوریتم در حفظ ساختار غیرخطی دادهها و یکپارچهسازی بهینه فرایندهای کاهش ابعاد و خوشهبندی است.
مقایسه سیستماتیک این روشها نشان میدهد اگرچه الگوریتمهای سنتی (سلسلهمراتبی و K-means) بهطور گسترده در تحقیقات بیومکانیکی استفاده میشوند، محدودیتهای ذاتی روش PCA در پردازش دادههای پیچیده حرکتی میتواند بر دقت نتایج تأثیر بگذارد. در مقابل، رویکردهای نوین مبتنی بر یادگیری عمیق با قابلیت استخراج خودکار ویژگیهای مرتبط، پتانسیل بالایی برای بهبود تحلیل الگوهای حرکتی در مطالعات بیومکانیکی دارند. این یافتهها میتواند بهعنوان مبنایی برای انتخاب روشهای بهینه در پژوهشهای آینده مورد استفاده قرار گیرد.
پژوهش حاضر همانند بسیاری از مطالعات دیگر محدودیتهایی داشته است. با وجود اینکه عوامل مختلف تأثیرگذار بر شناسایی الگوی حرکتی گروههای همگن در پژوهش حاضر کنترل شد، ضروری است عملکرد این الگوریتمها بر روی نمونه بزرگتری از دادههای بیومکانیکی متنوع آزمایش و تأیید شود. همچنین بررسی کارایی الگوریتمهای مختلف خوشهبندی در بررسی تأثیر مداخلات و پاسخ گروههای شناساییشده بر مداخلات درمانی و پیشگیرانه میتواند بینشهای ارزشمندی را درمورد کاربرد روشهای نوین در تحقیقات بیومکانیکی ارائه دهد.
ملاحظات اخلاقی
پیروی از اصول اخلاق پژوهش
در اجرای پژوهش ملاحظات اخلاقی مطابق با دستورالعمل کمیته اخلاق دانشگاه مازندران در نظر گرفته شده و کد اخلاق به شماره (IR.UMZ.REC.1403.097) دریافت شده است. در این مطالعه تمام اصول اخلاقی رعایت شد. اهداف و روشهای مطالعه به شرکتکنندگان توضیح داده شد. همچنین به آنها در مورد محرمانه ماندن اطلاعاتشان اطمینان داده شد و در هر زمان که می توانستند از مطالعه خارج شوند و در صورت تمایل، نتایج تحقیق در اختیار آنها قرار میگرفت.
حامی مالی
این مقاله برگرفته از رساله دکتری زانیار محمدی در گروه بیومکانیک ورزشی دانشگاه مازندران است. این پژوهش هیچگونه کمک مالی از سازمانهای دولتی، خصوصی و غیرانتفاعی دریافت نکرده است.
مشارکت نویسندگان
همه نویسندگان بهطور یکسان در مفهوم و طراحی مطالعه، جمعآوری و تجزیهوتحلیل دادهها، تفسیر نتایج و تهیه پیشنویس مقاله مشارکت داشتند.
تعارض منافع
بنابر اظهار نویسندگان، این مقاله تعارض منافع ندارد.
تشکر و قدردانی
نویسندگان از همکاری همه بیمارانی که در این مطالعه شرکت کردند، تشکر میکنند.
References
References