Clustering Kinematic Patterns of Runners: A Comparative Study of Hierarchical, K-Means, and Deep Temporal Clustering Algorithms

Document Type : Original article

Authors

1 Department of Sports Biomechanics, Faculty of Sports Sciences, University of Mazandaran, Babolsar, Iran.

2 Department of Computer Sciences, Faculty of Mathematical Sciences, University of Mazandaran, Babolsar, Iran.

10.32598/SJRM.14.5.3363

Abstract

Background and Aims Current biomechanical studies lack a comprehensive investigation of deep learning clustering algorithms for identifying homogeneous movement patterns in runners. This study aims to compare the performance of principal component analysis (PCA)-based hierarchical clustering and K-means algorithms with an end-to-end deep temporal clustering (DTC) approach in analyzing ankle joint kinematics of runners with homogeneous movement patterns.
Methods Three-dimensional ankle joint angles were obtained from 108 recreational runners (55 males and 53 females; age: 22.45±2.42 years, height: 1.69±0.11 m, body mass: 64.64±9.54 kg) during barefoot running at a speed of 3.0±3 meters per second. DTC, hierarchical, and K-means algorithms were trained using ankle joint angles during running. After clustering, the performance and accuracy of each algorithm in identifying clusters with homogeneous movement patterns were evaluated by calculating the Silhouette score, the Calinski-Harabasz index (CHI), and the Davies-Bouldin index (DBI).
Results In cluster separation, the DTC algorithm demonstrated superior performance and accuracy compared to the other two algorithms (silhouette score=0.74, DBI=0.35). This algorithm identified three distinct clusters with a clustering inconsistency rate of 6%. The hierarchical clustering method achieved a silhouette score of 0.68 and a DBI value of 0.52 in 10 seconds with a 15% inconsistency rate. The K-means method showed a silhouette score of 0.63 and a DBI of 0.78 in 3 seconds with an 18% inconsistency rate.
Conclusion The DTC algorithm outperforms hierarchical clustering and K-means clustering in identifying homogeneous movement patterns among runners. Its higher accuracy and lower learning error make it a suitable choice for analyzing kinematic data in biomechanical research. The findings can enhance the understanding and analysis of movement patterns and contribute to the development of effective strategies for prescribing targeted interventions.

Keywords

Main Subjects


Introduction
Running has become one of the most popular exercises due to its accessibility and low cost. However, the repetitive nature of running leads to a high incidence of overuse injuries. Epidemiological studies have reported an annual running-related injury rate of 19-79%, with 70% of cases involving the knee and lower limbs. Despite widespread preventive interventions, injury prevalence has not significantly decreased in recent decades, probably due to individual variability in response to treatments. This suggests that identifying homogeneous movement patterns and developing personalized interventions can be an effective strategy for injury prevention. While traditional clustering algorithms have been used to cluster runners with homogeneous movement patterns, their effectiveness is limited by challenges in processing biomechanical time-series data and capturing nonlinear movement features. Recent advances in deep temporal clustering (DTC) algorithms, utilizing deep autoencoders, have demonstrated superior capability in extracting complex temporal patterns and identifying homogeneous movement groups [7] also known as temporal clustering, is a challenging problem in machine learning. Here we propose a novel algorithm, DTC. This study aims to compare the performance of the DTC algorithm and conventional methods, including principal component analysis (PCA)-based K-means clustering and hierarchical clustering, for analyzing runners’ ankle kinematic data. We hypothesize that the DTC algorithm has greater accuracy due to its ability to model nonlinear relationships and preserve temporal dependencies in movement data. 

Methods
The study examined 108 recreational runners (Mean age: 22.45±2.42 years) using motion capture systems to analyze their ankle kinematics during running at a speed of 3.0±3 meters per second. Ankle kinematics were transformed into 101-point stance phase matrices for DTC and were reduced to 12 principal components for traditional clustering methods. Three clustering methods were utilized: 1) DTC algorithm employing a one-dimensional-convolutional neural network (1D-CNN) and a bidirectional long short-term memory (Bi-LSTM) model to extract temporal features and cluster data in latent space; 2) Hierarchical clustering with Ward’s linkage on PCA-reduced data; and 3) K-means clustering (k=2-8), optimized using the Calinski-Harabasz index (CHI). The cluster validity metrics included Silhouette score for cluster cohesion and Davies-Bouldin index (DBI) for inter-cluster separation; higher Silhouette scores (up to 1) and lower Davies-Bouldin values indicate better clustering performance. The DTC architecture was specifically designed to address limitations of convolutional methods in processing biomechanical time-series data through its temporal autoencoder design (Figure 1).

 


Results
The results showed that the DTC algorithm achieved superior cluster separation with a silhouette score of 0.74 and DBI value of 0.35, despite requiring a longer execution time (20 seconds). The DTC algorithm also showed the lowest clustering inconsistency rate (6%) and successfully identified three distinct clusters. Hierarchical clustering yielded a silhouette score of 0.68 and DBI value of 0.52, with an execution time of 10 seconds and a clustering inconsistency rate of 15%, and was able to identify three clusters. In contrast, the K-means method emerged as the fastest algorithm with an execution time of only 3 seconds, but showed relatively poorer clustering quality (silhouette score: 0.63; DBI: 0.78) and a higher clustering inconsistency rate (18%). The comparative analysis highlighted DTC’s superior performance in capturing meaningful movement patterns despite its greater computational time (Table 1).

 



Conclusion
There are significant differences in performance between hierarchical, K-means, and DTC algorithms in analyzing 3D ankle joint kinematics during running. DTC has superior clustering quality despite a longer execution time. Its integrated dimensionality reduction and clustering architecture, featuring an autoencoder and specialized clustering layer, has a lower clustering inconsistency rate and can effectively capture complex movement patterns. These results confirm DTC’s advantages over conventional clustering methods for movement pattern analysis. Conventional algorithms showed limitations primarily due to PCA-based dimensionality reduction, which eliminates nonlinear relationships in movement data. While PCA scaling is common, it alters data structure and complicates biomechanical interpretation. The DTC algorithm overcame these limitations by processing complete stance phase data without dimensionality reduction, preserving subtle movement variations. The DTC’s end-to-end unsupervised learning framework provides researchers with an improved tool for precise movement pattern analysis. Unlike traditional methods that may produce ambiguous results, DTC maintains data integrity while enabling meaningful clinical interpretation. This has particular promise for developing targeted interventions in running biomechanics, though additional validation studies are warranted to establish its clinical utility across diverse populations and movement conditions.

Ethical Considerations
Compliance with ethical guidelines
This study was approved by the Ethics Committee of the University of Mazandaran, Babolsar, Iran (Code: IR.UMZ.REC.1403.097). All ethical principles were considered in this study. The participants were informed about the research objectives and methods. They were also assured of the confidentiality of their information and were free to leave the study at any time, and if desired, the research results would be available to them.

Funding

This study was extracted from the dissertation of Zaniar Mohamadi at the Department of Sports Biomechanics, University of Mazandaran. This research did not receive any specific grant from funding agencies in the public, commercial, or not-for profit sectors. 

Authors' contributions
All authors contributed equally to the conception and design of the study, data collection and analysis, interpretation of the results, and drafting of the manuscript. Each author approved the final version of the manuscript for submission.

Conflict of interest
The authors declared no conflict of interest.

Acknowledgments
The authors would like to thank all the patients who participated in this study for their cooperation.

 

 

 

مقدمه و اهداف
دویدن به ‌دلیل دسترسی آسان و هزینه‌های پایین، یکی از رایج‌ترین فعالیت‌های ورزشی محسوب می‌شود و در میان عموم مردم محبوبیت زیادی یافته است [1]. با‌این‌حال با افزایش مشارکت و به ‌دلیل ماهیت تکراری این فعالیت، بروز آسیب‌های ناشی از پرکاری در میان دوندگان رایج شده است [2، 3]. بر‌اساس مطالعات اپیدمیولوژیک نرخ بروز آسیب‌های مرتبط با دویدن بین 19 تا 79 درصد در سال بوده که 70 درصد در زانو و بخش‌‌های تحتانی زانو گزارش شده ‌‌است [4]. با وجود استفاده گسترده از مداخلات پیشگیرانه و درمانی، شیوع آسیب‌های ناشی از دویدن طی دهه‌های اخیر کاهش معناداری نداشته است [5]. این نتایج ممکن است ناشی از تفاوت‌‌های فردی در پاسخ به مداخلات پیشگیرانه از قبیل کفش‌‌های مخصوص دویدن باشد. بر‌این‌اساس، شناسایی الگوهای حرکتی در گروه‌های همگن و طراحی مداخلات متناسب می‌تواند به تدوین دستورالعمل‌های مؤثرتر درمانی یا پیشگیرانه کمک کند [5]. 
اخیراً با استفاده از الگوریتم‌های خوشه‌بندی بدون نظارت، مطالعاتی جهت شناسایی خوشه‌‌هایی از دوندگان با الگوی حرکتی همگن انجام شده است [6، 7، 9]. اگرچه الگوریتم‌های خوشه‌بندی سنتی در برخی مطالعات به کار رفته‌اند، اما این روش‌ها اغلب برای داده‌های استاتیک با ابعاد کم طراحی شده‌اند و با داده‌های سری‌زمانی سازگاری مناسبی ندارند [10، 11]. بنابراین، استفاده از این الگوریتم‌ها برای پردازش داده‌های بیومکانیکی با چالش‌ بزرگی ابعاد داده‌‌ها مواجه است [11]. جهت رفع این چالش، معمولاً از روش تحلیل مؤلفه‌‌های اصلی استفاده می‌‌شود [12]. به این ترتیب که مجموعه‌‌ای از مؤلفه‌‌های اصلی که دربرگیرنده 70 تا 80 درصد از واریانس کل داده‌‌ها است، به‌عنوان ورودی الگوریتم استفاده می‌‌شود. با‌این‌حال   این روش با مشکلاتی نظیر نادیده گرفتن تفاوت‌های ظریف در الگوی حرکتی مواجه است [12]. برای مثال در یک پژوهش که گروه‌‌بندی عملکردی بر‌اساس سینماتیک پا و مچ پا در حین دویدن صورت گرفت، مقادیر پایین شاخص سیلوئت (0/13) و ضریب همبستگی کوفنتیک (0/38) نشان‌‌دهنده ناهمگنی گروه‌های شناسایی‌شده بود [6]. به‌طور‌کلی، ناتوانی روش‌‌های اخیر در گروه‌‌بندی عملکردی را می‌‌توان ناشی از محدودیت‌‌هایی از قبیل نادیده‌ گرفتن پیوستگی زمانی [13]، مقیاس‌بندی مجدد داده‌‌ها جهت تفسیر [5]، نادیده‌گرفتن روابط غیر‌‌خطی بین متغیرها [14]، وابستگی به محورهای انتخاب‌شده و همچنین محدود بودن معیارهای سنجش شباهت میان الگوها دانست [14].
برای غلبه بر این محدودیت‌ها، استفاده از الگوریتم‌های یادگیری عمیق، به‌ویژه خوشه‌بندی زمانی عمیق، پیشنهاد شده است [8]. مزیت اصلی این الگوریتم، استفاده از ساختار خودرمزنگار عمیق است که قادر به نگاشت اطلاعات غیرخطی و استخراج ویژگی‌های پیچیده سری‌زمانی در یک فضای پنهان است. پس از نگاشت داده‌ها به فضای پنهان، لایه خوشه‌بندی زمانی با استفاده از معیارهای متنوع برای اندازه‌گیری شباهت یا عدم شباهت، امکان شناسایی الگوهای حرکتی گروه‌های همگن را فراهم می‌کند که متناسب با نیاز و کاربرد قابل‌تنظیم است [8]علاوه‌بر‌این، این الگوریتم توانایی شناسایی موضعی رویدادها در داده‌های سری‌زمانی بدون برچسب را دارد و برخلاف رویکردهای جعبه‌سیاه، اطلاعاتی درباره مؤثرترین ویژگی‌ها در فرایند خوشه‌بندی ارائه می‌دهد .در یک تحقیق که روش خوشه‌‌بندی مبتنی بر نگاشت سرتاسری داده‌‌ها ، با روش‌‌های خوشه‌‌بندی مبتنی بر یادگیری ماشین مقایسه شد، نتایج نشان داد روش سرتاسری با میانگین نمودار مشخصه عملکرد 0/92 نسبت به روش‌‌های خوشه‌‌بندی مبتنی بر یادگیری ماشین با میانگین نمودار مشخصه عملکرد 0/88 برتری دارد [8]. الگوریتم خوشه‌‌بندی زمانی عمیق در 13 مجموعه داده سری‌‌زمانی متشکل از داده‌‌هایی با تعداد نمونه، توالی زمانی و نسبت توزیع خوشه گوناگون به‌طورکلی عملکرد بهتری نسبت به روش‌‌های خوشه‌‌بندی مبتنی بر یادگیری ماشین داشته است .
با‌این‌حال، بیشتر تحقیقات انجام‌شده در این زمینه بر داده‌های مربوط به حوزه‌های هوافضا و محیط ‌زیست متمرکز بوده‌اند. ازآنجا‌که داده‌های بیومکانیکی نیز ماهیت سری‌زمانی دارند و ویژگی‌های ویسکوالاستیسیته بافت‌های بدن انسان دارای خصوصیات منحصربه‌فردی هستند، بررسی کارایی این روش‌ها بر روی داده‌های بیومکانیکی ضروری به نظر می‌رسد [15]. به‌منظور اطمینان از عملکرد بهینه این روش‌ها بر روی داده‌های بیومکانیکی، انجام تحلیل مقایسه‌ای بین روش‌های مختلف خوشه‌بندی پیشنهاد می‌شود [11]. بر‌اساس مرور منابع موجود، تاکنون هیچ مطالعه‌ای به‌طور تجربی عملکرد الگوریتم‌های مذکور را در تحلیل داده‌های بیومکانیکی دوندگان بررسی نکرده است.
هدف مطالعه حاضر، مقایسه عملکرد الگوریتم‌های خوشه‌بندی سلسله‌مراتبی و ‌K-means مبتنی بر تحلیل مؤلفه‌های اصلی با الگوریتم خوشه‌بندی عمیق زمانی مبتنی بر نگاشت سرتاسری داده‌ها جهت شناسایی گروه‌‌های همگن دونده‌‌ها بود. این مطالعه می‌کوشد به بررسی اثربخشی روش‌های مختلف خوشه‌بندی یادگیری عمیق در تحلیل داده‌های سری‌زمانی جهت شناسایی گروه‌های دوندگان با الگوی حرکتی مشابه بپردازد. فرضیات تحقیق:
1. الگوریتم خوشه‌بندی عمیق زمانی، به دلیل قابلیت‌های پیشرفته در استخراج ویژگی‌های پیچیده داده‌های سری‌زمانی، در مقایسه با الگوریتم خوشه‌بندی K-means مبتنی بر تحلیل مؤلفه‌های اصلی، عملکرد و دقت بیشتری دارد. 
2. الگوریتم خوشه‌بندی عمیق زمانی، به دلیل بهره‌گیری از ساختار خودرمزنگار عمیق و توانایی در مدل‌سازی الگوهای غیرخطی، در مقایسه با الگوریتم خوشه‌بندی سلسله‌مراتبی مبتنی بر تحلیل مؤلفه‌های اصلی، دقت و کارایی بالاتری ارائه می‌دهد.

مواد و روش‌ها
108 دونده سالم تفریحی (سن: 2/42±‌22/45 سال، قد: 0/11±‌1/69 متر، جرم بدن: 9/54±‌64/64 کیلوگرم، جنسیت: 55 مرد، 53 زن) وارد مطالعه شدند. معیارهای ورود: نداشتن سابقه جراحی، شکستگی، سوختگی، مشکلات عصبی‌عضلانی، آسیب‌‌های حاد یا آسیب‌‌های ناشی از دویدن، نداشتن ضربات جدی در اندام تحتانی و عدم استفاده از اندام مصنوعی در ران، زانو و مچ پا، نداشتن ناهنجاری‌‌های ساختاری و عملکردی، مانند گودی کمر، صافی کمر، کف پای صاف و گود و همچنین زانوی ضربدری و پرانتزی، عدم استفاده از هر‌گونه کفی، نداشتن دیابت و بیماری‌‌های مربوط به اعصاب پیرامونی در 6 ماه قبل از آزمون و نداشتن هیچ‌گونه دردی در 3 ماه قبل از آزمون. اطلاعات مربوط به تست غربالگری توسط فیزیوتراپ متخصص کنترل شد.
یک صفحه نیروی Kistler (سوئیس) با فرکانس نمونه‌برداری 1000 هرتز در مرکز مسیر 15 متری نصب شد. برای کنترل سرعت، زمان طی شدن فاصله 5 متری از نقطه شروع تا برخورد با صفحه نیرو توسط 2 ارزیاب مستقل به‌صورت هم‌زمان و با استفاده از کرنومتر دیجیتال Q&Q-VQ47 (ژاپن) با دقت 0/01 ثانیه اندازه‌گیری شد. معیارهای پذیرش : 1. اختلاف زمانی کمتر از 0/05 ثانیه بین اندازه‌گیری‌های 2 ارزیاب؛ 2. سرعت در بازه 2/7 تا 3/3 متر بر ثانیه (متر بر پانیه 0/3±‌3). تحلیل قابلیت اطمینان، مقادیر خطای استاندارد اندازه‌گیری (متر بر ثانیه 0/11=SEM) و حداقل تغییر قابل‌تشخیص (‌متر بر ثانیه 0/3=95 درصد MDC) را نشان داد که بیانگر دقت مناسب روش اندازه‌گیری برای اهداف مطالعه بود. در این تحقیق، از مدل سینماتیکی دو بخشی برای مدل‌سازی ساق پا و پا به‌عنوان اجسام صلب بهره‌گیری شد که منطبق بر مدل‌های استاندارد 6 درجه آزادی است و به‌ویژه در مطالعات مرتبط با دویدن رایج است [16]. 7 نشانگر بازتابی بر روی برجستگی‌‌های استخوانی اپی‌کوندیل‌های داخلی و خارجی ران، قوزک‌های داخلی و خارجی، مرکز استخوان پاشنه در محل اتصال تاندون آشیل، انتهای دیستال استخوان‌های متاتارس 1 و 5 و همچنین پایه استخوان متاتارس دوم قرار داده شدند. همچنین یک کلاستر شامل 3 نشانگر روی ساق، به‌عنوان نشانگرهای آناتومیک و رهگیری استفاده شد (تصویر شماره 1).

 

 داده‌‌های سینماتیکی با استفاده از 6 دستگاه دوربین فیلم‌برداری شرکت Simi Motion ساخت آلمان با سرعت تصویربرداری 200 هرتز جمع‌‌آوری شدند. برای هر آزمودنی 3 تلاش موفق ثبت شد. مرحله استقرار دویدن با استفاده از نیروی عمودی عکس‌‌العمل زمین که حاصل از صفحه نیروسنج بود تعیین شد. داده‌های خام با استفاده از پالایه پایین‌گذر باترورث مرتبه چهارم در فرکانس برشی 16 هرتز (تعیین‌شده بر‌اساس روش تحلیل باقی‌مانده) پالایه شد (تصویر شماره 2) [15].

 

با استفاده از مختصات، زوایای سه‌بعدی مفصل مچ پا به روش توالی (XYZ) کاردان در محیط نرم‌‌افزار متلب نسخه 2022 محاسبه و داده‌‌ها از‌نظر زمانی به 100 درصد مرحله استقرار دویدن هنجار شد [15]. در‌نهایت برای هر آزمودنی یک ماتریس به ابعاد 101×3 تشکیل (جدول شماره 1) و به‌عنوان ورودی الگوریتم خوشه‌‌بندی به نرم‌افزار پایتون منتقل شد.

 


ماتریس داده
برای الگوریتم خوشه‌بندی زمانی عمیق، داده‌های هر آزمودنی در قالب ماتریسی با ابعاد 101×3 سازماندهی شد که سه ستون آن نمایانگر زوایای مفصل مچ پا در سه صفحه حرکتی (سهمی، عرضی و افقی) و 101 ردیف آن متناظر با 101 درصد مرحله استقرار دویدن بود. در‌نتیجه 108 ماتریس مجزا به ‌دست آمد. این داده‌ها در فایل‌های اکسل ذخیره و به‌عنوان ورودی الگوریتم عمیق زمانی(DTC) به کار گرفته شدند (جدول شماره 1). به‌منظور استفاده در الگوریتم‌های K-means و سلسله‌مراتبی، داده‌ها به‌صورت یک ماتریس 303×108 (تعداد ویژگی × تعداد آزمودنی) ادغام شدند. سپس با بهره‌گیری از تحلیل مؤلفه‌های اصلی (PCA)، مؤلفه‌هایی انتخاب شدند که در‌مجموع حداقل 95 درصد از واریانس داده‌ها را پوشش می‌دادند [12]. در‌نهایت، 12 مؤلفه اصلی استخراج و در قالب ماتریسی با ابعاد 12×108 به الگوریتم‌های خوشه‌بندی کلاسیک منتقل شدند (جدول شماره 2).

 


الگوریتم خوشه‌‌بندی عمیق زمانی
 در محیط نرم‌افزار پایتون نسخه 3/8 الگوریتم خوشه‌بندی عمیق زمانی با هدف خوشه‌‌بندی الگوهای سینماتیک اجرا شد. این الگوریتم در 3 مرحله پیاده‌سازی شد.
در مرحله اول، یک شبکه عصبی پیچشی یک‌بعدی (1D-CNN) برای استخراج ویژگی‌های محلی از داده‌های سری‌زمانی به کار گرفته شد.
مرحله دوم شامل استفاده از شبکه حافظه کوتاه‌مدت ـ بلندمدت دوطرفه برای مدل‌سازی روابط زمانی میان مقاطع مختلف داده بود.
در مرحله سوم، با بهره‌گیری از نمایش نهفته تولیدشده، خوشه‌بندی ناپارامتری در فضای زمانی‌مکانی انجام شد که منجر به شناسایی خوشه‌های حرکتی همگن شد (تصویر شماره 3).

 

الگوریتم خوشه‌‌بندی سلسله‌مراتبی: به‌منظور شناسایی الگوهای همگن در زوایای سه‌بعدی مفصل مچ پا، از الگوریتم خوشه‌بندی سلسله‌مراتبی مبتنی بر مؤلفه‌های اصلی استفاده شد [17، 18]. این رویکرد شامل 3 مرحله اصلی بود (تصویر شماره 4): محاسبه ماتریس فاصله بین آزمودنی‌ها بر‌اساس مؤلفه‌های اصلی استخراج‌شده؛ ادغام تدریجی خوشه‌ها با استفاده از روش پیوند و ساخت دندروگرام و تعیین تعداد خوشه‌ها با ارزیابی دندروگرام و استفاده از آستانه ناسازگاری که مقادیر بالاتر آن نشان‌دهنده تمایز بهتر خوشه‌ها هستند [17].

 

الگوریتم خوشه‌بندی K-means‌: الگوریتم K-means یکی از روش‌های خوشه‌بندی بدون نظارت است که هدف آن گروه‌بندی نمونه‌ها بر‌اساس الگوهای نهفته در داده‌هاست [19]. در این الگوریتم، ابتدا تعداد خوشه‌ها (k) به‌صورت پیش‌فرض یا بر‌پایه تحلیل‌های آماری مشخص می‌شود. سپس مراکز اولیه خوشه‌ها به‌صورت تصادفی انتخاب شده و هر نمونه بر‌اساس کمترین فاصله اقلیدسی به نزدیک‌ترین مرکز اختصاص می‌یابد [19، 20]. پس از تخصیص اولیه، مراکز خوشه‌ها با میانگین‌گیری از نقاط منتسب به هر خوشه به‌روزرسانی می‌شوند و این فرایند به‌صورت تکراری تا هم‌گرایی الگوریتم ادامه می‌یابد (تصویر شماره 5).

 

با‌توجه‌به وابستگی الگوریتم K-means به مقداردهی اولیه مراکز خوشه‌ها و احتمال قرارگیری در بهینه‌های موضعی (بدون دستیابی به بهینه سراسری)، تعیین مقدار بهینه پارامتر k از اهمیت ویژه‌ای برخوردار است [20]. در این مطالعه، با استناد به پیشینه پژوهش‌های بیومکانیکی که بازه 2 تا 8 خوشه را مناسب می‌دانند، الگوریتم در این بازه برای مقادیر مختلف k اجرا شد. سپس، کیفیت هر مدل با استفاده از شاخص کالنسکی ـ هارباز ارزیابی شد تا مناسب‌ترین تعداد خوشه شناسایی شود [20، 21].
معیار‌‌ ارزیابی: برای ارزیابی عملکرد الگوریتم‌های خوشه‌بندی، از 3 شاخص رایج شامل ضریب سیلوئت، شاخص دیویس ـ بولدین و شاخص کالینسکی ـ هاراباز استفاده شد [22]. ضریب سیلوئت میزان شباهت هر نمونه را به خوشه خود، نسبت به نزدیک‌ترین خوشه دیگر می‌سنجد. مقادیر نزدیک به 1 نشان‌دهنده کیفیت بالای خوشه‌بندی، مقادیر نزدیک به صفر نشانه‌ی مرزی بودن نمونه‌ها و مقادیر منفی بیانگر تخصیص نادرست هستند. شاخص دیویس ـ بولدین نیز با بررسی نسبت میانگین فشردگی درون خوشه به فاصله بین خوشه‌ها، عملکرد الگوریتم را ارزیابی می‌کند. مقادیر پایین‌تر نشان‌دهنده کیفیت بالاتر خوشه‌بندی هستند [22]. شاخص کالینسکی ـ هاراباز با محاسبه نسبت واریانس بین‌خوشه‌ای به درون‌خوشه‌ای، معیار کمّی جداسازی خوشه‌ها را ارائه می‌دهد. مقادیر بالاتر نشان‌دهنده ساختار خوشه‌ای قوی‌تر هستند.

یافته‌ها
این مطالعه به مقایسه عملکرد 3 الگوریتم خوشه‌بندی سلسله‌مراتبی، K-means و خوشه‌بندی عمیق زمانی در تحلیل داده‌های سینماتیکی سه‌بعدی مفصل مچ پای دوندگان پرداخته است. نتایج نشان می‌دهد خوشه‌بندی عمیق زمانی با نمره سیلوئت 0/74 و نمره 0/35 در شاخص دیویس ـ بولدین عملکرد مطلوبی در تفکیک خوشه‌ها به ثبت رسانده است. هرچند زمان اجرای آن 20 ثانیه بود. همچنین این الگوریتم کمترین نرخ ناسازگاری (6 درصد) را نشان داد و موفق به شناسایی 3 خوشه مجزا شد. خوشه‌بندی سلسله‌مراتبی نیز نمره سیلوئت 0/68 و نمره 0/52 در شاخص دیویس ـ بولدین را به همراه زمان اجرای 10 ثانیه و نرخ ناسازگاری 15 درصد به دست آورد، در‌حالی‌که تعداد خوشه‌های آن نیز 3 بود. در مقابل K-means با نمره سیلوئت 0/63 و نمره 0/78 در شاخص دیویس ـ بولدین، به‌عنوان سریع‌ترین الگوریتم شناخته شد و تنها 3 ثانیه برای اجرا نیاز داشت، اما با نرخ ناسازگاری 18 درصد و مقادیر پایین‌تر شاخص‌‌های ارزیابی کیفیت خوشه‌بندی، در مقایسه با دیگر روش‌ها، از‌نظر کیفیت خوشه‌‌‌بندی چندان قابل‌توجه نبوده است. همچنین جدول شماره 3 شامل نتایج اجرای هر‌یک از الگوریتم‌های خوشه‌بندی به همراه شاخص‌های سیلوئت، زمان اجرا، نرخ ناسازگاری و دیگر موارد مرتبط است (جدول شماره 3).

 



بحث
این مطالعه به مقایسه عملکرد 3 الگوریتم خوشه‌بندی سلسله‌مراتبی، K-means و خوشه‌بندی عمیق زمانی در تحلیل داده‌های سینماتیکی سه‌بعدی مفصل مچ پای دوندگان پرداخته است. ارزیابی عملکرد الگوریتم‌ها با استفاده از شاخص‌های سیلوئت، شاخص دیویس ـ بولدین و شاخص کالینسکی ـ هاراباز همراه با بررسی زمان اجرا و نرخ ناسازگاری انجام شد. یافته‌ها تفاوت‌های معناداری در عملکرد این الگوریتم‌ها نشان داد آن‌ها می‌توانند مبنای مناسبی برای انتخاب الگوریتم بهینه در خوشه‌بندی الگوهای حرکتی باشند.
نتایج پژوهش نشان‌دهنده برتری عملکرد الگوریتم خوشه‌بندی عمیق زمانی با شاخص سیلوئت 0/74 و شاخص کالینسکی ـ هاراباز 150 نسبت به 2 الگوریتم دیگر بود. این الگوریتم که از یک رمزگذار خودکار برای کاهش ابعاد و لایه‌های تخصصی خوشه‌بندی استفاده می‌کند. با وجود زمان اجرای 20  ثانیه‌ای، نرخ ناسازگاری پایینی (6 درصد) نشان داد (جدول شماره 3). این عملکرد مطلوب ناشی از یکپارچه‌سازی بهینه فرایندهای کاهش ابعاد و خوشه‌بندی در معماری الگوریتم است که توانایی شناسایی الگوهای پیچیده حرکتی را فراهم می‌کند [8، 11، 23]
تحلیل جامع شاخص‌های ارزیابی نشان می‌دهد الگوریتم خوشه‌بندی عمیق زمانی در تمامی معیارهای سنجش کیفیت خوشه‌بندی، نتایج بهتری نسبت به الگوریتم‌های سلسله‌مراتبی و K-means به‌دست آورده است (جدول شماره 3). این یافته‌ها فرضیه برتری دقت و کارایی الگوریتم عمیق زمانی را تأیید می‌کند. عملکرد ضعیف‌تر الگوریتم‌های سنتی احتمالاً به دلیل محدودیت‌های ذاتی روش تحلیل مؤلفه‌های اصلی در پردازش داده‌های پیچیده است [12]. این روش ضمن کاهش ابعاد داده‌ها، منجر به حذف بخشی از اطلاعات و روابط غیرخطی موجود در داده‌های حرکتی می‌شود [12، 14] که به‌طور محسوسی بر دقت شناسایی الگوهای همگن حرکتی تأثیر منفی گذاشته است [6]. بنابراین به نظر می‌رسد استفاده از روش‌های نوین مبتنی بر یادگیری عمیق می‌تواند گامی مؤثر در جهت بهبود دقت و کارایی خوشه‌بندی الگوهای حرکتی پیچیده باشد.
استفاده از روش‌های مقیاس‌بندی داده‌ها مانند تجزیه‌و‌تحلیل مؤلفه‌های اصلی برای هم‌وزن‌سازی متغیرها در الگوریتم‌های خوشه‌بندی سلسله‌مراتبی و K-means، اگرچه رویکردی متداول در پردازش داده‌ها محسوب می‌شود، اما چالش‌های مهمی را در مطالعات بیومکانیکی ایجاد می‌کند. این فرایند می‌تواند منجر به تغییر در ساختار ذاتی داده‌ها شده و درنتیجه تفسیر بالینی و بیومکانیکی نتایج را با مشکلات اساسی مواجه کند [6]. در مطالعات کاربردی در حوزه حرکتی، صرف شناسایی خوشه‌ها کافی نیست و تحلیل دقیق تغییرات الگوهای حرکتی بین خوشه‌های مختلف اهمیت بالایی دارد [24]. به‌ویژه در تحلیل‌های بیومکانیکی، درک زمان‌بندی و علل تغییرپذیری داده‌ها نسبت به خود فرایند گروه‌بندی از اولویت بالاتری برخوردار است [5، 9]. فرایند مقیاس‌بندی داده‌ها می‌تواند موانع جدی در شناسایی خوشه‌های بالینی و بیومکانیکی معنادار ایجاد کند، چالشی که به‌وضوح در پژوهش‌های مبتنی بر الگوریتم‌های سنتی خوشه‌بندی مشهود است [13، 14].
الگوریتم خوشه‌بندی زمانی عمیق، الگوهای حرکتی همگن را شناسایی و خوشه‌بندی می‌کند. برخلاف روش‌های سنتی که عموماً از تحلیل مؤلفه‌های اصلی به‌منظور کاهش ابعاد داده‌ها استفاده می‌کنند، این الگوریتم به‌طور کامل تمامی داده‌های مرحله استقرار دویدن را مدنظر قرار می‌دهد تا شباهت‌ میان الگوهای حرکتی را مشخص کند [8]؛ بنابراین با لحاظ تفاوت‌های ظریف الگوهای حرکتی، این الگوریتم قادر است تحلیل دقیق‌تری از الگوهای حرکت دویدن ارائه دهد و به خوشه‌بندی بهینه دست یابد [10]. همچنین ترکیب کاهش ابعاد و خوشه‌بندی زمانی در یک چارچوب یادگیری سرتاسری بدون نظارت، این الگوریتم را به ابزاری مؤثر برای شناسایی الگوهای حرکتی همگن تبدیل می‌کند [8]؛ بدین ترتیب، الگوریتم خوشه‌بندی عمیق زمانی، روشی بهبود‌یافته را برای پژوهشگران فراهم می‌آورد تا با دقت و کارایی بیشتر، الگوهای حرکتی را تجزیه‌و‌تحلیل و گروه‌بندی کنند.
نتایج مقایسه عملکرد 2 الگوریتم خوشه‌بندی K-means و سلسله‌مراتبی در تحلیل داده‌های بیومکانیکی با پیش‌پردازش تحلیل مؤلفه‌های اصلی(PCA) نشان داد. الگوریتم خوشه‌بندی K-means از‌لحاظ سرعت پردازش (3 ثانیه) نسبت به روش سلسله‌مراتبی (10 ثانیه) برتری دارد. با‌این‌حال، ارزیابی شاخص‌های کیفی، شامل نمره سیلوئت (0/68 در مقابل 0/63)، شاخص دیویس ـ بولدین (0/87 در مقابل 0/52) و نرخ ناسازگاری (15 درصد در مقابل 18 درصد) نشان‌دهنده عملکرد مطلوب‌ الگوریتم سلسله‌مراتبی در شناسایی الگوهای حرکتی همگن بود (جدول شماره 3). با وجود این، باید توجه داشت استفاده از PCA به‌عنوان روش کاهش ابعاد، با محدودیت‌هایی در پردازش داده‌های سری‌زمانی بیومکانیکی همراه است که می‌تواند بر تفسیر نتایج تأثیرگذار باشد [12، 13]. 
قبل از اجرای الگوریتم‌های خوشه‌بندی سلسله‌مراتبی و K-means، یک تحلیل مؤلفه‌های اصلی (PCA) به‌صورت یکجا بر روی کل مجموعه داده‌های سینماتیکی انجام شد. اگرچه این رویکرد به اجزای کاهش‌یافته اجازه می‌دهد تا الگوهای حرکتی را در تمام سطوح به‌طور هم‌زمان نشان دهند، ابعاد مجموعه داده را افزایش می‌دهد و اعتبار خارجی و پایداری PCA را محدود می‌کند [12، 13]. علاوه‌بر‌این تفسیر معنای عملی مؤلفه‌ها در هر صفحه پیچیده‌تر و مبهم‌ شده و احتمال بروز نتایج متناقض را افزایش می‌دهد [6، 13]. در مقابل، الگوریتم‌های خوشه‌بندی زمانی عمیق با حفظ ویژگی‌های اصلی داده‌ها، امکان تجزیه‌وتحلیل دقیق‌تر و تفسیر معنادار بالینی را فراهم می‌آورند.
پژوهش‌‌های پیشین نشان داده‌اند ویژگی‌های زیره میانی کفش به‌طور معناداری بر پارامترهای سینماتیکی و سینتیکی [5، 25، 26] و همچنین الگوی فعالیت عضلانی [27] در حین حرکت تأثیر می‌گذارند. در مطالعه حاضر، خوشه‌بندی بر‌اساس ارزیابی دویدن در شرایط پای برهنه اجرا شد (تصویر شماره 1). این رویکرد با این فرضیه طراحی شد که الگوی حرکتی پای برهنه می‌تواند به‌عنوان معیار پایه و نمایانگر الگوی حرکتی طبیعی شرکت‌کنندگان در نظر گرفته شود.

نتیجه‌گیری
این مطالعه به مقایسه عملکرد الگوریتم‌های خوشه‌بندی سلسله‌مراتبی و K-means مبتنی بر تحلیل مؤلفه‌های اصلی با الگوریتم خوشه‌بندی عمیق زمانی در تحلیل داده‌های سینماتیکی مفصل مچ پای دوندگان پرداخته است. یافته‌ها نشان داد الگوریتم خوشه‌بندی عمیق زمانی با بهره‌گیری از معماری پیشرفته مبتنی بر یادگیری عمیق، عملکرد مطلوب‌تری در شناسایی الگوهای پیچیده حرکتی و تفکیک خوشه‌ها دارد. این برتری عمدتاً به دلیل توانایی این الگوریتم در حفظ ساختار غیرخطی داده‌ها و یکپارچه‌سازی بهینه فرایندهای کاهش ابعاد و خوشه‌بندی است.
مقایسه سیستماتیک این روش‌ها نشان می‌دهد اگرچه الگوریتم‌های سنتی (سلسله‌مراتبی و K-means) به‌طور گسترده در تحقیقات بیومکانیکی استفاده می‌شوند، محدودیت‌های ذاتی روش PCA در پردازش داده‌های پیچیده حرکتی می‌تواند بر دقت نتایج تأثیر بگذارد. در مقابل، رویکردهای نوین مبتنی بر یادگیری عمیق با قابلیت استخراج خودکار ویژگی‌های مرتبط، پتانسیل بالایی برای بهبود تحلیل الگوهای حرکتی در مطالعات بیومکانیکی دارند. این یافته‌ها می‌تواند به‌عنوان مبنایی برای انتخاب روش‌های بهینه در پژوهش‌های آینده مورد استفاده قرار گیرد.
پژوهش حاضر همانند بسیاری از مطالعات دیگر محدودیت‌هایی داشته است. با وجود اینکه عوامل مختلف تأثیرگذار بر شناسایی الگوی حرکتی گروه‌های همگن در پژوهش حاضر کنترل شد، ضروری است عملکرد این الگوریتم‌‌ها بر روی نمونه بزرگ‌تری از داده‌‌های بیومکانیکی متنوع آزمایش و تأیید شود. همچنین بررسی کارایی الگوریتم‌‌های مختلف خوشه‌‌بندی در بررسی تأثیر مداخلات و پاسخ گروه‌‌های شناسایی‌شده بر مداخلات درمانی و پیشگیرانه می‌‌تواند بینش‌های ارزشمندی را در‌مورد کاربرد روش‌های نوین در تحقیقات بیومکانیکی ارائه دهد.

ملاحظات اخلاقی
پیروی از اصول اخلاق پژوهش

در اجرای پژوهش ملاحظات اخلاقی مطابق با دستورالعمل کمیته اخلاق دانشگاه مازندران در نظر گرفته شده و کد اخلاق به شماره (IR.UMZ.REC.1403.097) دریافت شده است. در این مطالعه تمام اصول اخلاقی رعایت شد. اهداف و روش‌های مطالعه به شرکت‌کنندگان توضیح داده شد. همچنین به آن‌ها در مورد محرمانه ماندن اطلاعاتشان اطمینان داده شد و در هر زمان که می توانستند از مطالعه خارج شوند و در صورت تمایل، نتایج تحقیق در اختیار آن‌ها قرار می‌گرفت.

حامی مالی
این مقاله برگرفته از رساله دکتری زانیار محمدی در گروه بیومکانیک ورزشی دانشگاه مازندران است. این پژوهش هیچ‌‌گونه کمک مالی از سازمان‌‌های دولتی، خصوصی و غیرانتفاعی دریافت نکرده است.

مشارکت نویسندگان
همه نویسندگان به‌طور یکسان در مفهوم و طراحی مطالعه، جمع‌آوری و تجزیه‌وتحلیل داده‌ها، تفسیر نتایج و تهیه پیش‌نویس مقاله مشارکت داشتند.

تعارض منافع
بنابر اظهار نویسندگان، این مقاله تعارض منافع ندارد. 

تشکر و قدردانی
نویسندگان از همکاری همه بیمارانی که در این مطالعه شرکت کردند، تشکر می‌کنند.

 

References

  1. Lee DC, Brellenthin AG, Thompson PD, Sui X, Lee IM, Lavie CJ. Running as a Key Lifestyle Medicine for Longevity. Progress in Cardiovascular Diseases. 2017; 60(1):45-55. [DOI:10.1016/j.pcad.2017.03.005] [PMID]
  2. Foch E, Milner CE. Influence of previous iliotibial band syndrome on coordination patterns and coordination variability in female runners. Journal of Applied Biomechanics. 2019; 35(5):305–11. [DOI:10.1123/jab.2018-0350] [PMID]
  3. Wilder RP, Sethi S. Overuse injuries: Tendinopathies, stress fractures, compartment syndrome, and shin splints. Clinics in Sports Medicine. 2004; 23(1):55-81, vi. [DOI:10.1016/S0278-5919(03)00085-1] [PMID]
  4. Hamill J, Palmer C, Van Emmerik RE. Coordinative variability and overuse injury. Sports Medicine, Arthroscopy, Rehabilitation, Therapy & Technology : SMARTT. 2012; 4(1):45. [DOI:10.1186/1758-2555-4-45] [PMID]
  5. Nigg BM. Biomechanics of sport shoes. Calgary: University of Calgary; 2010. [Link]
  6. Watari R, Suda EY, Santos JPS, Matias AB, Taddei UT, Sacco ICN. Subgroups of foot-ankle movement patterns can influence the responsiveness to a foot-core exercise program: A hierarchical cluster analysis. Frontiers in Bioengineering and Biotechnology. 2021; 9:645710. [DOI:10.3389/fbioe.2021.645710] [PMID]
  7. Senevirathna AM, Pohl AJ, Jordan MJ, Edwards WB, Ferber R. Differences in kinetic variables between injured and uninjured rearfoot runners: A hierarchical cluster analysis. Scandinavian Journal of Medicine & Science in Sports. 2023; 33(2):160-18. [DOI:10.1111/sms.14249] [PMID]
  8. Sai Madiraju N, Sadat SM, Fisher D, Karimabadi H. Deep temporal clustering: Fully unsupervised learning of time-domain features. arXiv e-prints. eprint arXiv:1802.01059. 2018. [DOI:48550/arXiv.1802.01059]
  9. Hoerzer S, von Tscharner V, Jacob C, Nigg BM. Defining functional groups based on running kinematics using Self-Organizing Maps and Support Vector Machines. Journal of Biomechanics. 2015; 48(10):2072-9. [DOI:10.1016/j.jbiomech.2015.03.017] [PMID]
  10. Alqahtani A, Ali M, Xie X, Jones MW. Deep time-series clustering: A review. Electronics. 2021; 10(23):3001. [DOI:10.3390/electronics10233001]
  11. Aghabozorgi S, Seyed Shirkhorshidi A, Ying Wah T. Time-series clustering - A decade review.Information Systems. 2015; 53:16-38. [DOI:10.1016/j.is.2015.04.007]
  12. Phinyomark A, Hettinga BA, Osis S, Ferber R. Do intermediate- and higher-order principal components contain useful information to detect subtle changes in lower extremity biomechanics during running? Human Movement Science. 2015; 44:91-101. [DOI:10.1016/j.humov.2015.08.018] [PMID]
  13. Jolliffe IT, Cadima J. Principal component analysis: A review and recent developments. Philosophical Transactions. Series A, Mathematical, Physical, and Engineering Sciences. 2016; 374(2065):20150202. [DOI:10.1098/rsta.2015.0202] [PMID]
  14. Ghojogh B, Crowley M, Karray F, Ghodsi A.. Principal Component Analysis. In: Elements of Dimensionality Reduction and Manifold Learning. Cham: Springer; 2023. [DOI:10.1007/978-3-031-10602-6_5]
  15. Winter DA. Biomechanics and motor control of human movement. New Jersey: John Wiley & Sons, Inc; 2009. [DOI:10.1002/9780470549148]
  16. Chalmers O, Page R, Langley B. A step towards dynamic foot classification: Functional grouping using ankle joint frontal plane motion in running. Gait & Posture. 2022; 97:35-9. [DOI:10.1016/j.gaitpost.2022.07.005] [PMID]
  17. Ran X, Xi Y, Lu Y, Wang X, Lu Z. Comprehensive survey on hierarchical clustering algorithms and the recent developments. Artificial Intelligence Review. 2023; 56(8):8219-64. [DOI:10.1007/s10462-022-10366-3]
  18. Martin JA, Stiffler-Joachim MR, Wille CM, Heiderscheit BC. A hierarchical clustering approach for examining potential risk factors for bone stress injury in runners. Journal of Biomechanics. 2022; 141:111136. [DOI:10.1016/j.jbiomech.2022.111136] [PMID]
  19. Chong B. K-means clustering algorithm: A brief review. Academic Journal of Computing & Information Science. 2021; 4(5). [DOI:10.25236/AJCIS.2021.040506]
  20. Oti EU, Olusola MO, Eze FC, Enogwe SU. Comprehensive Review of K-means Clustering Algorithms. International Journal of Advances in Scientific Research and 2021; 7(8):22-3. [DOI:10.31695/IJASRE.2021.34050]
  21. Rodriguez MZ, Comin CH, Casanova D, Bruno OM, Amancio DR, Costa LDF, et al. Clustering algorithms: A comparative approach. PLoS One. 2019; 14(1):e0210236. [DOI:10.1371/journal.pone.0210236] [PMID]
  22. Dudek A. Silhouette Index as Clustering Evaluation Tool. In: Jajuga K, Batóg J, Walesiak M, editors. Classification and Data Analysis. SKAD 2019. Studies in Classification, Data Analysis, and Knowledge Organization. Cham: Springer; 2020. [DOI:10.1007/978-3-030-52348-0_2]
  23. Tomašev N., Radovanović Clustering evaluation in high-dimensional data. In: Celebi M, Aydin K, editors. Unsupervised Learning Algorithms. Cham: Springer; 2016. [DOI:10.1007/978-3-319-24211-8_4]
  24. Hoitz F, von Tscharner V, Baltich J, Nigg BM. Individuality decoded by running patterns: Movement characteristics that determine the uniqueness of human running. PLoS One. 2021; 16(4):e0249657. [DOI:10.1371/journal.pone.0249657] [PMID]
  25. Hardin EC, van den Bogert AJ, Hamill J. Kinematic adaptations during running: Effects of footwear, surface, and duration. Medicine and Science in Sports and Exerc 2004; 36(5):838-44. [DOI:10.1249/01.MSS.0000126605.65966.40] [PMID]
  26. Cole GK, Nigg BM, Fick GH, Morlock MM. Internal loading of the foot and ankle during impact in running. Journal of applied biomechanics. 1995; 11(1):25-46. [Link]
  27. Wakeling JM, Pascual SA, Nigg BM. Altering muscle activity in the lower extremities by running with different sho Medicine and Science in Sports and Exercise. 2002; 34(9):1529-32. [DOI:10.1097/00005768-200209000-00021] [PMID]
  1. References

    1. Lee DC, Brellenthin AG, Thompson PD, Sui X, Lee IM, Lavie CJ. Running as a Key Lifestyle Medicine for Longevity. Progress in Cardiovascular Diseases. 2017; 60(1):45-55. [DOI:10.1016/j.pcad.2017.03.005] [PMID]
    2. Foch E, Milner CE. Influence of previous iliotibial band syndrome on coordination patterns and coordination variability in female runners. Journal of Applied Biomechanics. 2019; 35(5):305–11. [DOI:10.1123/jab.2018-0350] [PMID]
    3. Wilder RP, Sethi S. Overuse injuries: Tendinopathies, stress fractures, compartment syndrome, and shin splints. Clinics in Sports Medicine. 2004; 23(1):55-81, vi. [DOI:10.1016/S0278-5919(03)00085-1] [PMID]
    4. Hamill J, Palmer C, Van Emmerik RE. Coordinative variability and overuse injury. Sports Medicine, Arthroscopy, Rehabilitation, Therapy & Technology : SMARTT. 2012; 4(1):45. [DOI:10.1186/1758-2555-4-45] [PMID]
    5. Nigg BM. Biomechanics of sport shoes. Calgary: University of Calgary; 2010. [Link]
    6. Watari R, Suda EY, Santos JPS, Matias AB, Taddei UT, Sacco ICN. Subgroups of foot-ankle movement patterns can influence the responsiveness to a foot-core exercise program: A hierarchical cluster analysis. Frontiers in Bioengineering and Biotechnology. 2021; 9:645710. [DOI:10.3389/fbioe.2021.645710] [PMID]
    7. Senevirathna AM, Pohl AJ, Jordan MJ, Edwards WB, Ferber R. Differences in kinetic variables between injured and uninjured rearfoot runners: A hierarchical cluster analysis. Scandinavian Journal of Medicine & Science in Sports. 2023; 33(2):160-18. [DOI:10.1111/sms.14249] [PMID]
    8. Sai Madiraju N, Sadat SM, Fisher D, Karimabadi H. Deep temporal clustering: Fully unsupervised learning of time-domain features. arXiv e-prints. eprint arXiv:1802.01059. 2018. [DOI:48550/arXiv.1802.01059]
    9. Hoerzer S, von Tscharner V, Jacob C, Nigg BM. Defining functional groups based on running kinematics using Self-Organizing Maps and Support Vector Machines. Journal of Biomechanics. 2015; 48(10):2072-9. [DOI:10.1016/j.jbiomech.2015.03.017] [PMID]
    10. Alqahtani A, Ali M, Xie X, Jones MW. Deep time-series clustering: A review. Electronics. 2021; 10(23):3001. [DOI:10.3390/electronics10233001]
    11. Aghabozorgi S, Seyed Shirkhorshidi A, Ying Wah T. Time-series clustering - A decade review.Information Systems. 2015; 53:16-38. [DOI:10.1016/j.is.2015.04.007]
    12. Phinyomark A, Hettinga BA, Osis S, Ferber R. Do intermediate- and higher-order principal components contain useful information to detect subtle changes in lower extremity biomechanics during running? Human Movement Science. 2015; 44:91-101. [DOI:10.1016/j.humov.2015.08.018] [PMID]
    13. Jolliffe IT, Cadima J. Principal component analysis: A review and recent developments. Philosophical Transactions. Series A, Mathematical, Physical, and Engineering Sciences. 2016; 374(2065):20150202. [DOI:10.1098/rsta.2015.0202] [PMID]
    14. Ghojogh B, Crowley M, Karray F, Ghodsi A.. Principal Component Analysis. In: Elements of Dimensionality Reduction and Manifold Learning. Cham: Springer; 2023. [DOI:10.1007/978-3-031-10602-6_5]
    15. Winter DA. Biomechanics and motor control of human movement. New Jersey: John Wiley & Sons, Inc; 2009. [DOI:10.1002/9780470549148]
    16. Chalmers O, Page R, Langley B. A step towards dynamic foot classification: Functional grouping using ankle joint frontal plane motion in running. Gait & Posture. 2022; 97:35-9. [DOI:10.1016/j.gaitpost.2022.07.005] [PMID]
    17. Ran X, Xi Y, Lu Y, Wang X, Lu Z. Comprehensive survey on hierarchical clustering algorithms and the recent developments. Artificial Intelligence Review. 2023; 56(8):8219-64. [DOI:10.1007/s10462-022-10366-3]
    18. Martin JA, Stiffler-Joachim MR, Wille CM, Heiderscheit BC. A hierarchical clustering approach for examining potential risk factors for bone stress injury in runners. Journal of Biomechanics. 2022; 141:111136. [DOI:10.1016/j.jbiomech.2022.111136] [PMID]
    19. Chong B. K-means clustering algorithm: A brief review. Academic Journal of Computing & Information Science. 2021; 4(5). [DOI:10.25236/AJCIS.2021.040506]
    20. Oti EU, Olusola MO, Eze FC, Enogwe SU. Comprehensive Review of K-means Clustering Algorithms. International Journal of Advances in Scientific Research and 2021; 7(8):22-3. [DOI:10.31695/IJASRE.2021.34050]
    21. Rodriguez MZ, Comin CH, Casanova D, Bruno OM, Amancio DR, Costa LDF, et al. Clustering algorithms: A comparative approach. PLoS One. 2019; 14(1):e0210236. [DOI:10.1371/journal.pone.0210236] [PMID]
    22. Dudek A. Silhouette Index as Clustering Evaluation Tool. In: Jajuga K, Batóg J, Walesiak M, editors. Classification and Data Analysis. SKAD 2019. Studies in Classification, Data Analysis, and Knowledge Organization. Cham: Springer; 2020. [DOI:10.1007/978-3-030-52348-0_2]
    23. Tomašev N., Radovanović Clustering evaluation in high-dimensional data. In: Celebi M, Aydin K, editors. Unsupervised Learning Algorithms. Cham: Springer; 2016. [DOI:10.1007/978-3-319-24211-8_4]
    24. Hoitz F, von Tscharner V, Baltich J, Nigg BM. Individuality decoded by running patterns: Movement characteristics that determine the uniqueness of human running. PLoS One. 2021; 16(4):e0249657. [DOI:10.1371/journal.pone.0249657] [PMID]
    25. Hardin EC, van den Bogert AJ, Hamill J. Kinematic adaptations during running: Effects of footwear, surface, and duration. Medicine and Science in Sports and Exerc 2004; 36(5):838-44. [DOI:10.1249/01.MSS.0000126605.65966.40] [PMID]
    26. Cole GK, Nigg BM, Fick GH, Morlock MM. Internal loading of the foot and ankle during impact in running. Journal of applied biomechanics. 1995; 11(1):25-46. [Link]
    27. Wakeling JM, Pascual SA, Nigg BM. Altering muscle activity in the lower extremities by running with different sho Medicine and Science in Sports and Exercise. 2002; 34(9):1529-32. [DOI:10.1097/00005768-200209000-00021] [PMID]
Volume 14, Issue 5
November and December 2025
Pages 698-709
  • Receive Date: 04 May 2025
  • Revise Date: 07 May 2025
  • Accept Date: 21 May 2025
  • First Publish Date: 21 May 2025