Analysis of Clinical and Biomechanical Parameters of the Knee Joint in Patients With Osteoarthritis Using Big Data and Machine Learning Algorithms

Document Type : Original article

Authors

Department of Mechanical Engineering, Orthopaedic-BioMechanic Research Group, Faculty of Engineering, University of Birjand, Birjand, Iran.

10.32598/SJRM.14.5.3386

Abstract

Background and Aims Knee osteoarthritis (OA) is a prevalent chronic condition in the elderly, primarily caused by degeneration of articular cartilage. It leads to pain and restricted mobility, and is often diagnosed at an advanced stage. Risk factors include obesity, genetic predisposition, and skeletal deformities such as valgus and varus knees. This study aimed to evaluate the potential of artificial intelligence (AI) and machine learning (ML) techniques in the statistical analysis and prediction of knee OA severity using biomechanical and clinical data.
Methods Based on a follow-up study, radiographic knee joint images were analyzed using AI-based methods to extract bone boundaries. Key biomechanical parameters, including joint space width (JSW), femoral-tibial angle (FTA), and joint line convergence angle (JLCA), as well as clinical variables, such as weight, height, body mass index (BMI), age, and gender, were measured. ML models, including K-nearest neighbors (KNN), artificial neural networks (ANN), binary and multiclass CatBoost, and random forest classifiers, were used in statistical analysis to determine the relationship between these variables and OA severity. Also, statistical regression and Pearson’s correlation coefficient were used to analyze the data.
Results The results showed that minimum JSW, FTA, JLCA, and weight significantly affected OA progression. The binary CatBoost model achieved 82% accuracy, and the multiclass CatBoost model demonstrated 60% accuracy with 73% sensitivity for identifying mild OA cases based on biomechanical parameters. Additionally, the random forest classification framework within CatBoost achieved an overall accuracy of 54% and showed better performance in analyzing clinical parameters compared to other models.
Conclusion ML models, particularly CatBoost and Random Forest, demonstrate promising performance in predicting and evaluating knee OA progression. These findings highlight the potential of ML techniques as supportive tools in clinical decision-making for the diagnosis and monitoring of OA.

Keywords

Main Subjects


Introduction
Knee osteoarthritis (OA) is a chronic, progressive joint disorder affecting a significant portion of the aging population. It is characterized by cartilage degradation, leading to joint pain, stiffness, and impaired mobility. Traditional diagnostic methods often detect OA in advanced stages, limiting opportunities for early intervention. Several clinical factors, such as obesity, age, genetic predisposition, and skeletal deformities (e.g. varus/valgus knees), contribute to OA progression. Moreover, biomechanical parameters extracted from radiographic images correlate with disease severity. With the advent of artificial intelligence (AI), machine learning (ML) offers new avenues for early OA diagnosis and severity prediction by analyzing the complex interactions between clinical and biomechanical data.

Methods
Data set: This study was based on a follow-up of participants in the APPROACH cohort (mean age: 66.5 years), all of whom experienced knee pain. Image processing: Bone boundaries were detected using BoneFinder (University of Manchester), biomechanical parameters, joint space width (JSW), femoral-tibial angle (FTA), and joint line convergence angle (JLCA), as well as clinical variables, such as weight, height, body mass index (BMI), age, and gender were measured. were extracted via ODEA (University of Birjand).
Image Processing: Bone boundaries were detected using the random forest technique, and biomechanical parameters such as JSW, FTA, and JLCA, as well as clinical variables like weight, height, BMI, age, and gender, were measured. These variables were extracted using the ODIA software developed at the University of Birjand.
Modeling: AI and ML techniques were employed to extract bone boundaries from radiographic images of the knee joint. Biomechanical parameters such as JSW, FTA, and JLCA, along with clinical variables like weight, height, BMI, age, and gender, were measured. The ML models used in this study included K-nearest neighbors (KNN), artificial neural network (ANN), binary CatBoost, multiclass CatBoost, and Random Forest classifiers, which were used in statistical analysis to explore the relationship between these variables and osteoarthritis severity. Statistical regression and Pearson correlation coefficient analyses were performed to evaluate the data.

Sampling method and data splitting
For data sampling and analysis, ML methods including K-Nearest Neighbors (KNN), artificial neural networks (ANN), and two CatBoost models (binary and multivariate), were implemented in the Python environment. To split the data into training and testing sets, binary classification models and stratified Random Forest classifiers were applied to ensure a balanced distribution of osteoarthritis severity levels (based on the Kellgren–Lawrence scale). To address class imbalance in the dataset, oversampling was performed using the synthetic minority over-sampling technique within the Python environment, utilizing the imbalanced-learn library. Software and Libraries used for sampling and analysis:

Python
Scikit-learn, imbalanced-learn, and pandas libraries for data splitting and preprocessing.

Results
The results showed that minimum JSW, FTA, JLCA, and weight had significant effects on OA progression. The binary CatBoost model achieved 82% accuracy, and the multiclass CatBoost model demonstrated 60% accuracy with 73% sensitivity for identifying mild OA cases based on biomechanical parameters. Additionally, the Random Forest classification framework within CatBoost achieved an overall accuracy of 54% and showed better performance in analyzing clinical parameters compared to other models.

Conclusion
This study confirms the potential of ML-based approaches. ML models, particularly CatBoost and Random Forest, demonstrate promising performance in predicting and evaluating knee OA progression. These findings highlight the potential of ML techniques as supportive tools in clinical decision-making for OA diagnosis and monitoring.

Ethical Considerations
Compliance with ethical guidelines

This study was conducted at Birjand University using data collected in compliance with the protocol, Good Clinical Practice, the Declaration of Helsinki, and applicable ethical and legal regulatory requirements (for all countries involved), and is registered under clinicaltrials.gov nr: NCT03883568. All participants received oral and written information and provided written informed consent.

Funding
This article was extracted from the dissertation of Ali Bahramian at the Orthopedic-Biomechanics Research Group, Department of Mechanical Engineering, University of Birjand.

Authors' contributions
Statistical analysis: Ali Bahramian; Drafting the manuscript: Vahid Arbabi. 

Conflict of interest
The authors declared no conflicts of interest.

Acknowledgments
The authors would like to thank all participants for their cooperation in this study.

 

مقدمه و اهداف
امروزه رادیوگرافی به‌عنوان یکی از ابزارهای کلیدی در تشخیص بیماری‌های مفصل زانو، به‌ویژه آرتروز، شناخته می‌شود [1]. مفصل زانو، استخوان‌های ران و درشت‌نی را به هم متصل می‌کند، از پیچیده‌ترین و حیاتی‌ترین مفاصل بدن است و به‌دلیل تحمل فشارهای زیاد و دامنه حرکتی بالا، مستعد آسیب‌هایی نظیر درد، ساییدگی و تخریب بافت‌های سخت می‌باشد [2]. آرتروز زانو بیماری مزمن و پیش‌رونده‌ای است که با تخریب غضروف مفصلی و ایجاد درد و محدودیت حرکتی همراه است. این وضعیت معمولاً بر اثر فعالیت‌هایی که فشار زیادی بر مفصل وارد می‌کنند، شدت می‌گیرد [3، 4]. 
براساس یک مرور نظام‌مند و فراتحلیل شامل 88 مطالعه، شیوع جهانی آرتروز زانو در افراد بالای 40 سال حدود 22/9 درصد گزارش شده است که معادل تقریباً 654 میلیون نفر در سال 2020 برآورد می‌شود [5]. همچنین نتایج مطالعه‌ای دیگر نشان می‌دهد شیوع جهانی آرتروز زانو 4376 مورد به ازای هر 100٬000 نفر (معادل 4/38 درصد) بوده است و این میزان در فاصله سال‌های 1990 تا 2019، افزایش 7/5 درصدی داشته است [6]. در ایران، مطالعه‌ای در شهر کرمانشاه بر روی افراد بالای 50 سال نشان داد 39/5 درصد از زنان و 38/6 درصد از مردان سابقه درد زانو داشته‌اند که بیانگر شیوع بالای آرتروز زانو در این گروه سنی است [7]. برای ارزیابی شدت بیماری، معیار کلگرن - لارنس (KL) که بر پایه تصاویر رادیوگرافی است، کاربرد دارد. این معیار، شدت آسیب غضروفی را در 5 درجه (از 0 تا 4) طبقه‌بندی می‌کند، به‌طوری‌که درجه صفر نشان‌دهنده مفصل سالم و درجه 4 بیانگر آرتروز شدید است [8]. برای کنترل پیشرفت آرتروز و بهبود عملکرد مفصل زانو، روش‌هایی نظیر آموزش، ورزش‌درمانی، کاهش وزن و مصرف داروهای مُسکِن به‌کار می‌رود [9]. عضلات اطراف زانو نقش مهمی در ثبات بیومکانیکی این مفصل دارند و ضعف آن‌ها می‌تواند 4 به افزایش فشار، تغییر شکل استخوان و ایجاد زائده‌های استخوانی منجر شود [10].
باتوجه‌به اهمیت روزافزون تشخیص و پیشگری زودهنگام آرتروز زانو، پژوهش‌های متعددی به بررسی آن از دیدگاه‌های گوناگون پرداخته‌اند. اندازه‌گیری دقیق مرزهای استخوانی و پارامترهای مفصلی در تحلیل پیشرفت بیماری، نقشی کلیدی دارد. 
مطالعه ماریجنیسن و همکاران [11] با استفاده از نرم‌افزار کیدا (KIDA) اندازه‌گیری‌های دستی دقیقی از مفصل انجام شده است که با بهره‌گیری از پردازش تصویر و مرزهای استخوانی، داده‌هایی قابل‌اطمینان فراهم شده است. رایگان و همکاران [12] با بهره‌گیری از نرم‌افزار بون‌فایندر و اودیا، برای نخستین بار روشی دقیق و خودکار را برای استخراج پارامترهای آناتومیکی و مفصلی معرفی کردند. ماتیاس و همکاران [13]، نیز از شبکه عصبی کانولوشنال برای طبقه‌بندی شدت آرتروز براساس تصاویر رادیوگرافی استفاده کردند، هرچند نمونه‌های محدود این مطالعه، دقت کلی نتایج را تحت تأثیر قرار داد. در نهایت، طیبه طارق و همکاران [14] از الگوریتم یادگیری عمیق و طبقه‌بندی ترتیبی برای تشخیص دقیق‌تر شدت آرتروز استفاده کردند تا روند بیماری به‌درستی در نظر گرفته شود.
روش‌های گوناگونی در راستای اندازه‌گیری پارامترهای مفصل زانو ارائه شده است. ضخامت فضای مفصل با استفاده از روش نقطه میانی و نرم‌افزار متلب اندازه‌گیری شد [15]. ضخامت فضای مفصل (JSW) را با استفاده از رادیوگرافی میکروکانونی با وضوح بالا بررسی کردند [16]. تغییرات ضخامت فضای مفصل و زاویه بین استخوان‌های ران و درشت‌نی (FTA) با درجه آرتروز و هم‌ترازی استخوان‌ها بررسی شد [17]. همچنین روش‌های متفاوتی در راستای بررسی ارتباط میزان شدت آرتروز با پارامترهای بالینی و بیومکانیکی ارائه شده است. از جمله، با استفاده از الگوریتم رگرسیون جنگل تصادفی (RF)، ارتباط متغیرهایی چون سن، جنسیت و شاخص توده بدنی را با روند پیشرفت آرتروز بررسی گردید [18]. با استفاده از تصویربرداری مغناطیسی (WORMS) و الگوریتم‌های یادگیری ماشین، روند پیشرفت آرتروز طی 8 سال بررسی شد [19]. با به‌کارگیری رگرسیون لجستیک، تأثیر عوامل بالینی مانند سن، جنس و شاخص توده بدنی را در پیش‌بینی درجه کلگرن – لارنس ارزیابی گردید [20]. 
در بیشتر مطالعات پیشین، اندازه‌گیری‌ها به‌صورت دستی و بر پایه روش‌های ساده هندسی انجام شده است که این امر باعث کاهش دقت و نادیده گرفتن بخش‌هایی از آناتومی مفصل شده است. افزون بر این، محدودیت در حجم داده و تعداد شرکت‌کنندگان باعث کاهش تعمیم‌پذیری نتایج شده است. بررسی جامع ارتباط بین پارامترهای بیومکانیکی (نظیر ضخامت فضای مفصل و زاویه مفصل) و ویژگی‌های بالینی (سن، جنس و شاخص توده بدنی) نیز اغلب به‌صورت موردی و محدود صورت گرفته است.
با وجود استفاده از نرم‌افزار اودیا در مطالعات پیشین، تاکنون تحلیل آماری شدت آرتروز براساس داده‌های این نرم‌افزار با مدل‌های یادگیری ماشین مانند نزدیک‌ترین همسایه (KNN)، شبکه عصبی مصنوعی (ANN) و کت‌بوست به‌طور جامع بررسی نشده است. در این پژوهش، با بهره‌گیری از نرم‌افزار اودیا [12]، متغیرهایی چون ضخامت فضای مفصل، زاویه راستای مفصل و زاویه همگرایی در مجموعه داده‌ای بزرگ‌تر و با تعداد نمونه بیشتر و دقت بالا اندازه‌گیری شد. سپس برای نخستین بار، تحلیل آماری و ارتباط این پارامترهای بیومکانیکی با شدت آرتروز با استفاده از مدل‌های یادگیری ماشین مذکور مورد تحلیل قرار گرفت. همچنین، ارتباط شدت آرتروز با پارامترهای بالینی نظیر سن، جنس، وزن، قد و شاخص توده بدنی با استفاده از تحلیل آماری رگرسیون و ضریب همبستگی پیرسون بررسی شد. 
هدف اصلی این پژوهش، تحلیل آماری و پیش‌بینی شدت آرتروز زانو از طریق داده‌های بیومکانیکی و بالینی با استفاده از روش‌های یادگیری ماشین می‌باشد.

مواد و روش‌ها
این مطالعه از داده‌های پروژه کنسرسیوم اروپایی (APPROACH) بر روی 297 بیمار با میانگین سنی 66/5 سال که در هنگام ورود به مطالعه حداقل به مدت 2 سال علائم درد در ناحیه مفصل زانو را گزارش داده بودند، انجام شد. تصاویر رادیوگرافی با استفاده از روش‌های استاندارد شامل تصویربرداری خمش-ثابت و خلفی-قدامی جمع‌آوری شدند (تصویر شماره 1) [21].

 

 

ابتدا، مرزهای استخوانی مفصل زانو از تصاویر رادیوگرافی استخراج شدند. این فرآیند با استفاده از نرم‌افزار بون‌فایندر که بر پایه الگوریتم‌های یادگیری ماشین و به‌ویژه مدل جنگل تصادفی  عمل می‌کند، انجام شد. سپس، متغیرهای بیومکانیکی مفصل زانو شامل ضخامت فضای مفصل، زاویه راستای مفصل و زاویه همگرایی، با استفاده از نرم‌افزار اودیا (مبتنی بر برنامه‌نویسی متلب) اندازه‌گیری شدند [12]. 
برای نمونه‌گیری و تحلیل داده‌ها، از روش‌های یادگیری ماشین شامل نزدیک‌ترین همسایه، شبکه عصبی مصنوعی و دو مدل کت‌بوست « شامل مدل‌های باینری و چندمتغیره » در محیط نرم‌افزار پایتون استفاده شد. 
به‌منظور تقسیم داده‌ها به مجموعه‌های آموزش و آزمون، از روش‌های مدل طبقه‌بندی باینری و جنگل تصادفی به‌صورت طبقه‌بندی‌شده استفاده شد تا توزیع متعادلی از درجات مختلف آرتروز براساس مقیاس کلگرن-لارنس در داده‌ها حفظ گردد. همچنین، به‌منظور مقابله با عدم توازن بین کلاس‌ها، از تکنیک نمونه‌برداری بیش ‌از‌ حد با استفاده از روش بیش‌نمونه‌سازی مصنوعی اقلیت در محیط پایتون و با بهره‌گیری از کتابخانه عدم تعادل- یادگیری استفاده شد.
- نرم‌افزارها و کتابخانه‌های مورد استفاده برای نمونه‌گیری و تحلیل داده‌ها شامل موارد زیر بودند:

- نرم‌افزار پایتون
- کتابخانه‌های اسکیت، عدم تعادل و پانداس برای تقسیم داده‌ها، پیش‌پردازش و یادگیری ماشین.
برای انجام تحلیل آماری، ارتباط بین پیشرفت آرتروز و پارامترهای مختلف مورد بررسی قرار گرفت. این پارامترها شامل 17 متغیر بیومکانیکی (حداقل ضخامت فضای مفصل پای چپ، حداکثر ضخامت فضای مفصل پای چپ، حداقل ضخامت فضای مفصل پای راست، حداکثر ضخامت فضای مفصل پای راست، زاویه راستای مفصل پای چپ، زاویه راستای مفصل پای راست، زاویه همگرایی مفصل پای چپ، زاویه همگرایی مفصل پای راست، حداقل ضخامت فضای مفصل در قسمت خارجی، حداکثر ضخامت فضای مفصل در قسمت خارجی، میانگین ضخامت فضای مفصل قسمت خارجی، حداقل ضخامت فضای مفصل در قسمت داخلی، حداکثر ضخامت فضای مفصل در قسمت داخلی، میانگین ضخامت فضای مفصل قسمت داخلی، میانگین کل ضخامت فضای مفصل، زاویه همگرایی در پایین‌ترین نقطه مفصل پای راست، زاویه همگرایی در پایین‌ترین نقطه مفصل پای چپ) و متغیرهای بالینی مانند جنسیت، وزن، قد، شاخص توده بدنی و سن بودند. 
به‌ منظور تحلیل داده‌ها، از روش‌های یادگیری ماشین مانند نزدیک‌ترین همسایه، شبکه عصبی مصنوعی و دو مدل کت‌بوست « شامل مدل‌های باینری (CB) و چندمتغیره (MC) » استفاده شد. همچنین، برای انجام طبقه‌بندی، از مدل جنگل تصادفی نیز بهره گرفته شد.

روش الگوریتم جنگل تصادفی برای تعیین مرز استخوان مفصل زانو
الگوریتم جنگل تصادفی، الگوریتمی یادگیری نظارت‌شده محسوب می‌شود. در این مطالعه برای شناسایی و استخراج دقیق مرزهای استخوانی مفصل زانو به‌ کار گرفته شد. این الگوریتم با ترکیب نتایج حاصل از چندین درخت تصمیم، پیش‌بینی‌های قابل‌اعتمادی ارائه می‌دهد. هر درخت تصمیم در این الگوریتم، بر روی زیرمجموعه‌ای تصادفی از داده‌های آموزشی و نیز زیرمجموعه‌ای تصادفی از ویژگی‌ها، آموزش داده می‌شود. سپس، خروجی نهایی جنگل تصادفی از طریق تجمیع نتایج همه درخت‌های تصمیم (مثلاً با رأی اکثریت در مسائل طبقه‌بندی یا میانگین‌گیری در مسائل رگرسیون) تعیین می‌شود [22].
یکی از ویژگی‌های برجسته این روش، مقاومت بالای آن در برابر مشکل بیش‌برازش است. بیش‌برازش، یکی از چالش‌های رایج در یادگیری ماشین است که در آن، مدل بر داده‌های آموزشی به‌شدت تنظیم می‌شود و در نتیجه، عملکرد ضعیفی بر روی داده‌های جدید از خود نشان می‌دهد. الگوریتم جنگل تصادفی با استفاده از مکانیسم تجمعی و تصادفی‌سازی، این مشکل را به‌طور مؤثری کاهش می‌دهد [22].
در این پژوهش، نقاط آناتومیکی کلیدی استخوان‌های مفصل زانو ابتدا به‌صورت دستی توسط متخصصین شناسایی و جانمایی شدند. این نقاط به‌عنوان داده‌های ورودی برای آموزش نرم‌افزار بون‌فایندر استفاده شدند. این نرم‌افزار با بهره‌گیری از روش‌های یادگیری ماشین و اجرای الگوریتم جنگل تصادفی، قادر به استخراج خودکار مرزهای استخوانی مفصل زانو شد. نتایج حاصل از این فرآیند نشان‌دهنده دقت و کارایی بالای الگوریتم در تشخیص و استخراج دقیق مرزهای استخوانی بود که در تصویر شماره 2 نمایش داده شده است.

 

این رویکرد، علاوه‌بر کاهش خطاهای انسانی در مرحله شناسایی دستی، زمان موردنیاز برای پردازش داده‌ها را نیز به‌طور قابل‌توجهی کاهش داد. 

اندازه‌گیری متغیرهای مفصل زانو
ارزیابی دقیق پارامترهای بیومکانیکی مفصل زانو، نقش کلیدی در تشخیص و پیش‌بینی میزان پیشرفت آرتروز دارد. در این پژوهش، از نرم‌افزار اودیا برای اندازه‌گیری پارامترهای ضخامت فضای مفصل، زاویه استخوان درشت‌نی و زاویه همگرایی مفصل (JLCA)، استفاده شد. در ادامه، روش محاسبه هر کدام تشریح شده است [12].

اندازه‌گیری ضخامت فضای مفصل
برای محاسبه ضخامت مفصل، همان‌طور که در (تصویر شماه 3) نشان داده شده است.

 

مرزی مشخص تعیین شد که فاصله آن معادل 15/2 فاصله بین نقاط شماره 7 و 26 در دو کناره مفصل در نظر گرفته شد. طول این خط که معادل 20/3 فاصله کل بین این دو نقطه است، به‌عنوان پایه‌ای برای محاسبه ضخامت مفصل استفاده شد. علاوه‌براین، از دایره‌هایی که به‌صورت مماس بر لبه‌های استخوان‌های تشکیل‌دهنده فضای مفصل قرار گرفته‌اند، برای اندازه‌گیری دقیق‌تر ضخامت فضای مفصل استفاده شد. قطر بزرگ‌ترین و کوچک‌ترین دایره‌های مماس به‌ترتیب نشان‌دهنده حداکثر و حداقل ضخامت فضای مفصل هستند. این دایره‌ها فاصله عمودی بین دو استخوان تشکیل‌دهنده مفصل را اندازه‌گیری می‌کنند که باعث می‌شود روش محاسبه ضخامت فضای مفصل با استفاده از این روش، نسبت به روش‌های سنتی، دقت بیشتری داشته باشد [11]. این رویکرد نه‌تنها به‌دلیل استفاده از الگوریتم‌های دقیق برای تخمین فاصله بین استخوان‌ها، بلکه به‌دلیل لحاظ کردن تغییرات محلی در ضخامت مفصل، از اهمیت ویژه‌ای برخوردار است [12]. تصویر شماه 3 نحوه استفاده از این دایره‌ها و خطوط مرجع را برای محاسبه ضخامت فضای مفصل نشان می‌دهد.

اندازه‌گیری زاویه راستای مفصل
زاویه راستای مفصل با استفاده از تعیین دو محور آناتومیکی استخوان‌های ران (فمور) و ساق پا (درشت‌نی) محاسبه گردید. برای استخراج محور آناتومیکی استخوان فمور، خطی از مرکز سر استخوان ران تا نقطه آناتومیکی شماره 69 ترسیم شد. در مورد استخوان درشت‌نی، محور آناتومیکی از طریق میانگین خط واصل دو نقطه آناتومیکی شماره 15 و 19، واقع در ناحیه انتهایی دیافیز این استخوان، تعیین شد [12].
به‌منظور افزایش دقت در تعیین این محورها، از روشی مکمل نیز استفاده شد. در این روش، دایره‌هایی بر مسیر انحنای مرزهای استخوان‌های فمور و درشت‌نی مماس شده و مرکز هندسی این دایره‌ها به‌عنوان نقاط مرجع جهت تعریف دقیق‌تر محورهای آناتومیک به‌کار رفته‌اند [12]. این روش امکان اصلاح یا تقویت برآورد اولیه محورها را فراهم کرده و در مواردی که انحنا یا تغییر شکل در استخوان‌ها مشاهده می‌شود، عملکرد قابل‌اعتمادتری ارائه می‌دهد. زاویه راستای مفصل که از تلاقی این دو محور به‌دست می‌آید، یکی از متغیرهای کلیدی در تحلیل راستای اندام تحتانی محسوب می‌شود و نقش مهمی در ارزیابی وضعیت بیومکانیکی زانو ایفا می‌کند. انحراف از مقادیر نرمال این زاویه ممکن است نمایانگر تغییرات آسیب‌شناختی در ساختار مفصل باشد. تصویر شماره 4 روند دقیق ترسیم محورهای آناتومیکی و نحوه محاسبه زاویه راستای مفصل را نشان می‌دهد.

 


اندازه‌گیری زاویه همگرایی مفصل
زاویه همگرایی مفصل زانو در این مطالعه با استفاده از نرم‌افزار اودیا محاسبه شد. برای تعیین این زاویه، ابتدا دو خط مرجع به نام‌های L2 و L3 بر اساس موقعیت‌های آناتومیکی مشخص‌شده روی مرز استخوان‌ها تعریف شدند. خط L2 نمایانگر راستای کندیل‌های استخوان فمور است و از نقاط شماره 63 تا 68 در بخش داخلی (مدیال) و نقاط 70 تا 75 در بخش خارجی (لترال) این استخوان عبور می‌کند. این خط بیانگر راستای سطح مفصلی استخوان ران در نمای رادیوگرافی است. خط L3 نیز به‌منظور نمایش راستای سطح پلاتوی استخوان درشت‌نی ترسیم شده و از نقاط شماره 9 تا 13 در سمت مدیال و 20 تا 25 در سمت لترال تیبیال عبور می‌کند. زاویه بین این دو خط، زاویه همگرایی مفصل را تشکیل می‌دهد که معیاری کمی برای ارزیابی هم‌راستایی مفصل زانو در تصاویر رادیوگرافی است [12]. مقادیر غیرطبیعی این زاویه می‌تواند نشانگر وجود ناهنجاری‌های مفصلی، از جمله تغییرات مرتبط با آرتروز باشد. تصویر شماره 5 نحوه ترسیم خطوط مرجع و روش اندازه‌گیری زاویه همگرایی مفصل را به‌صورت شماتیک نمایش می‌دهد.

 


روش تحلیل آماری 
به‌منظور ارزیابی میزان وابستگی بین «پیشرفت آرتروز زانو و مجموعه‌ای از پارامترهای بالینی و بیومکانیکی مرتبط با مفصل زانو» و شدت بیماری، از تحلیل‌های آماری کلاسیک شامل رگرسیون آماری و ضریب همبستگی پیرسون با استفاده از نرم‌افزار SPSS نسخه 27 محاسبه گردید. این تحلیل‌ها امکان شناسایی روابط خطی و معنادار میان متغیرهای کلیدی را فراهم می‌کنند و مبنایی برای انتخاب ورودی‌های مؤثر در مدل‌سازی پیش‌بینانه فراهم می‌سازند. افزون بر روش‌های آماری سنتی، برای مدل‌سازی و پیش‌بینی شدت آرتروز از رویکردهای مبتنی بر یادگیری ماشین نیز استفاده شد. در این راستا، چند الگوریتم قدرتمند مورد استفاده با کدنویسی در نرم‌افزار پایتون شامل «الگوریتم نزدیک‌ترین همسایه»، «شبکه عصبی مصنوعی» و «مدل کت‌بوست در دو ساختار باینری (برای تفکیک افراد سالم از مبتلا) و چندمتغیره (برای پیش‌بینی شدت آرتروز در پنج سطح کلگرن–لارنس)»  انجام شده است.
برای انجام فرآیند طبقه‌بندی بیماران براساس درجات مختلف شدت آرتروز نیز از مدل جنگل تصادفی استفاده شد. ترکیب این روش‌ها امکان تحلیل چندجانبه داده‌ها را فراهم کرده و بستر مناسبی برای شناسایی پارامترهای تأثیرگذار و توسعه مدل‌های پیش‌بینی‌کننده فراهم ‌می‌آورد، در ذیل روش توزیع داده‌ها در هر بخش ارائه شده است.
 
ضریب همبستگی پیرسون 
ضریب همبستگی پیرسون معیاری آماری برای سنجش میزان و نوع رابطه خطی بین دو متغیر کمی است (فرمول شماره 1). این ضریب با نماد R نمایش داده می‌شود و مقدار آن در بازه‌ای بین 1- تا 1+ قرار دارد. مقدار R=0 بیانگر عدم وجود همبستگی خطی بین دو متغیر است، درحالی‌که R=+1 به معنای وجود همبستگی کامل مثبت (رابطه مستقیم کامل) و R=−1 نشان‌دهنده همبستگی کامل منفی (رابطه معکوس کامل) بین آن‌هاست [23].

 




روش نزدیک‌ترین همسایه 
در این مطالعه، از الگوریتم نزدیک‌ترین همسایه (KNN) به‌عنوان یک روش یادگیری نظارت‌شده برای بررسی ارتباط میان پیشرفت آرتروز و ترکیب پارامترهای بیومکانیکی و بالینی استفاده شده است. این الگوریتم فاصله میان نمونه‌ها را محاسبه کرده و براساس K نمونه نزدیک‌تر، مقدار یا کلاس جدید را پیش‌بینی می‌کند. [24]. برای ارزیابی مدل، داده‌ها به دو مجموعه آموزش و آزمون تقسیم شده و پس از یادگیری از مجموعه آموزشی، عملکرد مدل به نسبت80 درصد از داده‌های آموزش و 20 درصد از آزمون، برای پیش‌بینی شدت آرتروز در داده‌های جدید مراحل سرچ الگوریتم بررسی گردید. 

شبکه عصبی مصنوعی 
شبکه عصبی مصنوعی به‌عنوان یکی از روش‌های پیشرفته یادگیری ماشین جهت تحلیل ارتباط میان شدت آرتروز زانو و متغیرهای بیومکانیکی و بالینی استفاده شد. این مدل بر پایه ساختاری متشکل از چندین لایه پردازشی متوالی بنا شده است که در آن هر لایه شامل تعدادی نورون‌ (واحد پردازشی) است. داده‌های ورودی با عبور از این نورون‌ها و اعمال وزن‌های اختصاصی، به لایه‌های بعدی منتقل شده و در نهایت، خروجی تولید می‌شود. فرآیند آموزش مدل شبکه عصبی مصنوعی شامل سه مرحله اصلی است:

۱. انتشار رو به جلو
در این مرحله، داده‌های ورودی به‌صورت متوالی از لایه‌های شبکه عبور می‌کنند و خروجی موقت محاسبه می‌شود.

۲. محاسبه خطا
 اختلاف بین خروجی واقعی و خروجی موردانتظار (برچسب داده) اندازه‌گیری می‌شود.

۳. انتشار به عقب
 با استفاده از الگوریتم گرادیان نزولی، وزن‌های شبکه به‌گونه‌ای به‌روزرسانی می‌شوند که خطای مدل در تکرارهای بعدی کاهش یابد [25]. 
در این تحقیق، برای آموزش و ارزیابی مدل، مجموعه داده‌ها به دو بخش تقسیم شدند: 80 درصد از داده‌ها برای آموزش و 20 درصد برای آزمون مدل اختصاص یافت (جدول شماره 1).

 

تابع فعال‌سازی مورداستفاده در نورون‌ها، تابع سیگموید بود که امکان مدل‌سازی روابط غیرخطی بین متغیرها را فراهم می‌سازد. فرآیند آموزش تا زمان همگرایی مدل و رسیدن به دقت بهینه ادامه یافت. پس از اتمام آموزش، عملکرد مدل با استفاده از داده‌های آزمون مورد ارزیابی قرار گرفت.

روش کت‌بوست
الگوریتم کت‌بوست یکی از پیشرفته‌ترین روش‌های یادگیری ماشین مبتنی بر بوستینگ است که شرکت یاندیکس آن را توسعه داده است. این الگوریتم به‌طور خاص برای کار با داده‌های طبقه‌بندی‌شده طراحی شده و از مزایایی همچون عدم نیاز به پیش‌پردازش پیچیده داده‌ها و مدیریت خودکار ویژگی‌های غیرعددی برخوردار است. کت‌بوست با بهره‌گیری از تکنیک‌های گرادیان بوستینگ، مجموعه‌ای از مدل‌های ضعیف (مانند درخت‌های تصمیم ساده) را به‌صورت تکراری ترکیب می‌کند تا مدلی قوی و با دقت بالا ایجاد نماید. در این مطالعه، الگوریتم کت‌بوست در دو ساختار اصلی اجرا و مورد تحلیل قرار گرفته است:

-کت‌بوست باینری
 این ساختار برای طبقه‌بندی دودویی به‌کار گرفته می‌شود، به‌گونه‌ای که نمونه‌ها براساس ویژگی‌های داده به یکی از دو دسته مشخص (مثلاً «سالم» یا «مبتلا») تقسیم می‌شوند. در این حالت، مدل تلاش می‌کند با دقت بالا بین دو برچسب (0) و (1) تمایز قائل شود.

- کت‌بوست چندمتغیره
 در این ساختار، مدل قادر است داده‌ها را به بیش از دو کلاس متمایز طبقه‌بندی کند. در این پژوهش، پیش‌بینی شدت آرتروز براساس مقیاس درجه‌بندی کلگرن – لارنس از جمله کاربردهای این ساختار محسوب می‌شود.
در این پژوهش، داده‌ها به دو بخش مجموعه آموزش و مجموعه آزمون تقسیم شده و مدل‌ها بر روی داده‌های آموزش، آموزش دیدند. سپس عملکرد آن‌ها با استفاده از داده‌های آزمون مورد ارزیابی قرار گرفت. برای سنجش عملکرد مدل‌های کت‌بوست، از مجموعه‌ای از شاخص‌های آماری استاندارد استفاده شد که شامل این موارد هستند [25] :
برای ارزیابی عملکرد مدل‌ها، از این معیارها استفاده می‌شود: 
معیارهای دقت، حساسیت، دقت پیش‌بینی مثبت، دقت پیش‌بینی منفی (NPV) و افزایش مثبت (PPV) محاسبه و تحلیل شدند. در کنار این معیارها، برای تحلیل خطاهای طبقه‌بندی نیز از شاخص‌های تشخیص صحیح و نادرست استفاده شد:
- مشخصه‌های TP: تعداد مواردی که مدل به‌درستی آن‌ها را در کلاس 1 (مبتلا) شناسایی کرده است.
- مشخصه‌های TN: تعداد نمونه‌هایی که مدل به‌درستی آن‌ها را در کلاس 0 (سالم) طبقه‌بندی کرده است.
- مشخصه‌های FP: تعداد نمونه‌هایی که مدل به‌اشتباه آن‌ها را به‌عنوان مبتلا  طبقه‌بندی کرده است، در حالی‌که واقعاً سالم بوده‌اند.
- مشخصه‌های FN: تعداد نمونه‌هایی که مدل به ‌اشتباه آن‌ها را به‌عنوان سالم تشخیص داده، درحالی‌که در واقع مبتلا بوده‌اند.
مقادیر دقیق این شاخص‌ها و فرمول‌های محاسبه آن‌ها ارائه شده‌اند (فرمول‌های شماره 2، 3، 4، 5، 6، 7) [13]:



2. برخورد یا حساسیت (R):




3. دقت پیش‌بینی مثبت (P):

4.


4. دقت پیش‌بینی منفی (NPV):




5. افزایش مثبت ( P):




6. معیار Score -F1 :




معیار Score -F1 یک معیار جامع است که هم دقت پیش‌بینی مثبت و هم حساسیت را مورد ارزیابی قرار می‌دهد. این معیار به‌طور هم‌زمان توازن بین دقت و حداقل اشتباهات کاذب را نیز بررسی می‌کند. 

یافته‌ها
در این پژوهش، تحلیل آماری و مدل‌سازی یادگیری ماشین برای بررسی ارتباط پارامترهای بیومکانیکی و بالینی با شدت آرتروز زانو انجام شد. روش‌های مورداستفاده شامل ضریب همبستگی پیرسون، نزدیکترین همسایه، شبکه عصبی مصنوعی، مدل کت‌بوست باینری و مدل کت‌بوست چندمتغیره بود.
تحلیل همبستگی پیرسون
برای ارزیابی ارتباط بین شدت آرتروز با 17 متغیر بیومکانیکی (جدول شماره 2) و عوامل بالینی (جنس، سن، قد، وزن و شاخص توده بدن)، از ضریب همبستگی پیرسون استفاده شد. نتایج نشان داد:

 

وزن با شدت آرتروز همبستگی مثبت و معنادار داشت (0/036= P و 0/122=r)، درحالی‌که شاخص توده بدن همبستگی غیرمعنادار و ضعیف نشان داد (0/079=P و 0/103=r).
- زاویه راستای مفصل در پای چپ همبستگی منفی و معنادار با شدت آرتروز داشت (0/001=P و 0/220=r)، اما همین پارامتر در پای راست ارتباط معناداری نداشت.
- زاویه همگرایی مفصل زانوی چپ همبستگی مثبت و معنادار نشان داد (0/006=P و 0/185=r) که بیانگر افزایش زاویه با تشدید بیماری بود.
- حداقل ضخامت فضای مفصل همبستگی معکوس و معناداری با شدت آرتروز داشت (0/036=P و 0/122=r) که نشان‌دهنده کاهش ضخامت مفصل با پیشرفت بیماری بود. 
- در مجموع، متغیرهای بیومکانیکی نظیر زاویه همگرایی و ضخامت فضای مفصل بیشترین ارتباط را با شدت آرتروز داشتند، در حالی‌که متغیرهای عمومی‌تر نظیر سن و جنسیت فاقد ارتباط معنادار بودند.

پیش‌بینی میزان شدت آرتروز با روش کت‌بوست- باینری
در این تحلیل، نمونه‌ها براساس مقیاس کلگرن-لارنس به دو کلاس تقسیم شدند (جدول شماره 3): کلاس 0 (درجات 0 و 1) و کلاس 1 (درجات 2 تا 4).

 

هدف، ارزیابی عملکرد مدل در تفکیک این دو گروه بود. نتایج حاصل از مدل‌های مختلف در طبقه‌بندی داده‌های بالینی به شرح زیر است (جدول شماره 4):

 

- مدل جنگل تصادفی در چارچوب کت‌بوست، با دقت 54 درصد بهترین عملکرد را داشت.
- مدل کت‌بوست باینری عملکردی مشابه با جنگل تصادفی داشت.
- شبکه عصبی مصنوعی و نزدیک‌ترین همسایه به‌ترتیب با دقت 44/07 درصد و 47 درصد، عملکرد ضعیف‌تری نشان دادند.
یافته‌ها نشان دادند مدل‌های مبتنی بر درخت تصمیم، به‌ویژه کت‌بوست، به‌دلیل مدیریت مؤثر عدم توازن داده‌ها و استخراج ویژگی‌های مهم، در پیش‌بینی آرتروز عملکرد بهتری دارند. در مقابل، مدل‌های KNN و ANN به‌دلیل نیاز به داده‌های بیشتر و محدودیت در شناسایی الگوهای پیچیده، نتایج ضعیف‌تری داشتند.
بر اساس (جدول شماره 5)، عملکرد مدل کت‌بوست در مقایسه با جنگل تصادفی در تحلیل داده‌های بالینی مورد ارزیابی قرار گرفت.

 

نتایج نشان داد مدل کت‌بوست با دقت کلی 54 درصد عملکردی هم‌سطح با جنگل تصادفی داشت. حساسیت مدل برای تشخیص کلاس سالم (0) برابر با 47 درصد و برای کلاس آرتروزدار (1) معادل 61 درصد بود که نشان‌دهنده توان بالاتر مدل در شناسایی بیماران مبتلا به آرتروز است.
مقادیر F1-score برای کلاس‌های 0 و 1 به‌ترتیب 51 درصد و 57 درصد درصد گزارش شد که بیانگر عملکرد متوازن مدل در تفکیک این دو گروه می‌باشد. همچنین، میانگین‌های ماکرو و وزنی معیارهای ارزیابی هر دو برابر با 54 درصد بودند که هم‌ترازی عملکرد مدل با جنگل تصادفی را تأیید می‌کنند.
به‌طورکلی، مدل کت‌بوست در تشخیص موارد سالم دقت کمتری نسبت به موارد آرتروزدار داشت که این موضوع بر لزوم بهینه‌سازی بیشتر مدل برای بهبود عملکرد در تشخیص نمونه‌های غیربیمار دلالت دارد.
 جدول شماره 6 عملکرد مدل کت‌بوست-باینری را در طبقه‌بندی آرتروز بر پایه پارامترهای بیومکانیکی ارائه می‌دهد.

 

دقت کلی مدل 79 درصد بوده که بیانگر توان بالای آن در شناسایی صحیح نمونه‌هاست. در کلاس سالم (کلاس 0)، دقت، حساسیت و F1-score  به‌ترتیب 82 درصد، 85 درصد و 84 درصد گزارش شده که نشان‌دهنده عملکرد مطلوب مدل در تفکیک نمونه‌های غیربیمار است. درمقابل، مدل در تشخیص کلاس آرتروزدار (کلاس 1) عملکرد ضعیف‌تری داشته است؛ به‌طوری‌که دقت 74 درصد، حساسیت 69 درصد و F1-score برابر با 71 درصد به‌دست آمده است. این نتایج بیانگر چالش مدل در شناسایی دقیق افراد مبتلا به آرتروز می‌باشند.
میانگین ماکرو برای معیارهای دقت، حساسیت و F1-score به‌ترتیب برابر با 78 درصد، 77 درصد و 78 درصد و میانگین وزنی آن‌ها نیز معادل 79 درصد بوده است؛ نتایجی که نشان‌دهنده تعادل نسبی مدل در طبقه‌بندی کلاس‌ها و اثربخشی مراحل بهینه‌سازی جهت کاهش اثرات عدم توازن داده‌ها هستند.
به‌طورکلی، اگرچه مدل کت‌بوست-باینری در شناسایی نمونه‌های سالم موفق عمل کرده، اما بهبود عملکرد در تشخیص بیماران آرتروزدار می‌تواند به افزایش دقت کلی و بهینه‌سازی بیشتر سیستم‌های تشخیص خودکار منجر شود.
تصویر شماره 6 ماتریس آشفتگی عملکرد مدل کت‌بوست-باینری را براساس پارامترهای بیومکانیکی نمایش می‌دهد.

 

این ماتریس نشان‌دهنده دقت مطلوب مدل در شناسایی نمونه‌های سالم (کلاس 0) است، اما ضعف نسبی آن در تشخیص دقیق نمونه‌های آرتروزدار (کلاس 1) نیز مشهود است و به بهبود نیاز دارد.
مطابق جدول شماره 7، عملکرد مدل‌های مختلف یادگیری ماشین در طبقه‌بندی کلاس‌های سالم و آرتروزدار مورد ارزیابی قرار گرفته است.

 

مدل کت‌بوست-باینری با دقت مثبت 79 درصد و دقت کلی 74 درصد در تشخیص کلاس آرتروزدار، عملکرد بهتری نسبت به مدل جنگل تصادفی با دقت‌های 77 درصد و 73 درصد نشان داده است. این نتایج بیانگر کارایی بالاتر کت‌بوست-باینری در شناسایی موارد مثبت بیماری است.
در ارزیابی سایر مدل‌ها، دقت مدل نزدیک‌ترین همسایه 74/43 درصد و مدل شبکه عصبی مصنوعی 73/31 درصد گزارش شده است. مقایسه دقت پیش‌بینی کلاس سالم (کلاس 0) در بین مدل‌ها به‌ترتیب زیر است:
مدل کت‌بوست باینری: 82 درصد،
مدل کت‌بوست با کلاس‌بندی جنگل تصادفی: 79 درصد،
نزدیک‌ترین همسایه: 84/20 درصد،
شبکه عصبی مصنوعی: 89/60 درصد.
با وجود دقت بالای برخی مدل‌ها در پیش‌بینی کلاس سالم، مدل کت‌بوست-باینری به‌دلیل تعادل مناسب میان دقت در هر دو کلاس و قابلیت استخراج ویژگی‌های مؤثر، عملکرد کلی بهتری دارد. این ویژگی، آن را به گزینه‌ای مناسب برای تحلیل داده‌های بیومکانیکی و طبقه‌بندی بیماران مبتلا به آرتروز زانو تبدیل می‌کند.
نتایج جدول شماره 8 نشان می‌دهد مدل کت‌بوست-باینری در تحلیل داده‌های بیومکانیکی با دقت 79 درصد عملکرد بسیار بهتری نسبت به زمانی دارد که از داده‌های بالینی (با دقت 54 درصد) استفاده می‌شود.

 

این تفاوت قابل‌توجه در دقت مدل، تأکیدی بر اهمیت بالاتر پارامترهای بیومکانیکی در پیش‌بینی شدت آرتروز زانو نسبت به متغیرهای عمومی بالینی است و نقش تعیین‌کننده این متغیرها را در بهبود کیفیت پیش‌بینی مدل‌های یادگیری ماشین برجسته می‌سازد.

پیش‌بینی میزان شدت آرتروز با روش کت‌بوست - چند متغیره
فرآیند آماده‌سازی داده‌ها برای آموزش و آزمون در این بخش مشابه روش‌های مورد استفاده در مدل‌سازی‌های پیشین انجام شده است. جدول شماره 9 توزیع تعداد نمونه‌ها را در هر کلاس شدت آرتروز بر اساس مقیاس کلگرن-لارنس برای مدل کت‌بوست چندمتغیره نشان می‌دهد.

 

ارزیابی عملکرد مدل براساس داده‌های بالینی در جدول شماره 10 ارائه شده است.

 

نتایج بیانگر آن است که مدل در طبقه‌بندی کلاس‌های 0 و 1 (سالم و آرتروز خفیف) عملکرد نسبتاً بهتری داشته، درحالی‌که در طبقه‌بندی کلاس‌های با شدت بالاتر (کلاس‌های 3 و 4)، به‌دلیل حجم محدود نمونه‌ها، دقت و حساسیت کاهش یافته است. دقت کلی مدل 0/33 و میانگین وزنی F1-score برابر با 0/35 گزارش شده که نشان‌دهنده عملکرد متوسط مدل در تفکیک بین کلاس‌ها است.
ماتریس آشفتگی (تصویر شماره 7) نیز بیانگر آن است که بیشترین دقت مدل در شناسایی کلاس 1 (آرتروز خفیف) بوده و در سایر درجات، به‌ویژه کلاس‌های بالاتر، افت محسوسی در عملکرد مشاهده شده است.

 

این وضعیت می‌تواند به‌دلیل توزیع نامتوازن داده‌ها، هم‌پوشانی ویژگی‌ها بین کلاس‌ها و نیز ماهیت تدریجی پیشرفت آرتروز باشد که مرز مشخصی بین درجات مختلف آن ایجاد نمی‌کند.
برای بهبود عملکرد مدل پیشنهاد می‌شود: افزایش حجم داده‌های آموزشی، استفاده از روش‌های مدیریت عدم‌توازن داده (مانند oversampling یا SMOTE) و بهینه‌سازی هایپرپارامترهای مدل به‌صورت نظام‌مند صورت گیرد.
در مدل کت‌بوست– چندمتغیره با استفاده از پارامترهای بیومکانیکی، توزیع نمونه‌ها در هر کلاس (جدول شماره 11) بسیار گسترده‌تر از داده‌های بالینی بوده و به‌ویژه کلاس 1 (آرتروز خفیف) با 482 نمونه، بیشترین تعداد را به خود اختصاص داده است.

 

کلاس 4 (آرتروز شدید) نیز همچنان با 21 نمونه کمترین سهم را دارد.
عملکرد مدل در این حالت (جدول شماره 12) نشان‌دهنده بهبود قابل‌ملاحظه در توانایی پیش‌بینی شدت آرتروز است.

 

دقت کلی مدل به 0/60 افزایش یافت و معیارهای حساسیت و F1-score نیز نتایج مناسبی ارائه دادند:
- حساسیت برای کلاس 0: 54 درصد
- حساسیت برای کلاس 1: 73 درصد
- میانگین ماکرو برای دقت، حساسیت و F1-score به‌ترتیب برابر با 0/50، 0/48 و 0/58
- میانگین وزنی این معیارها نیز در حدود 60 درصد گزارش شد- حساسیت برای کلاس 0: 54 درصد
- حساسیت برای کلاس 1: 73 درصد
- میانگین ماکرو برای دقت، حساسیت و F1-score به‌ترتیب برابر با 0/50، 0/48 و 0/58
- میانگین وزنی این معیارها نیز در حدود 60 درصد گزارش شد.
مطابق ماتریس آشفتگی (تصویر شماره 8)، مدل بیشترین دقت را در شناسایی کلاس 1 (آرتروز خفیف) داشته و عملکرد آن در کلاس‌های 0، 2 و 3 نسبتاً پایین‌تر بوده است.

 

در مورد کلاس 4، به‌دلیل حجم بسیار پایین داده، مدل توانایی کافی در شناسایی صحیح نمونه‌ها از خود نشان نداد.
این یافته‌ها نشان می‌دهد مدل در پیش‌بینی مراحل اولیه آرتروز به‌ویژه در کلاس 1 عملکرد مطلوبی دارد، اما در تمایز بین کلاس‌های با شدت بالاتر یا کلاس‌هایی با داده‌های نامتوازن، با کاهش دقت مواجه است. این مسئله ضرورت به‌کارگیری روش‌های تقویت داده، بالانس‌سازی کلاس‌ها و بهینه‌سازی بیشتر مدل را برجسته می‌سازد.

بحث
مطالعات پیشین در زمینه تحلیل آماری، ارتباط میان شدت آرتروز زانو و پارامترهای بیومکانیکی (نظیر ضخامت فضای مفصل و زاویه راستای مفصل) و همچنین عوامل بالینی (از جمله جنس، سن و شاخص توده بدنی) عمدتاً به‌صورت موردی با جامعه آماری محدود و بدون بهره‌گیری از رویکردهای یادگیری ماشین انجام شده‌اند. همچنین، یافته‌های گذشته نشان داده‌اند که پارامترهای بالینی مانند سن، جنسیت و شاخص توده‌بدنی به‌تنهایی توان پیش‌بینی بالایی درخصوص شدت آرتروز ندارند و دقت کافی را فراهم نمی‌کنند. ازسوی‌دیگر، رویکردهایی نظیر رگرسیون لجستیک و تحلیل‌های مبتنی بر یادگیری عمیق بر روی تصاویر رادیوگرافی، به‌دلیل محدودیت در شفاف‌سازی روابط میان ویژگی‌ها، نتوانسته‌اند عملکرد قابل‌قبولی در تفسیر بیومکانیکی مفصل زانو ارائه دهند. در آن‌ها نیز به‌طور جامع از ترکیب داده‌های حاصل از نرم‌افزارهای تحلیلی تخصصی مانند اودیا و الگوریتم‌های یادگیری ماشین برای پیش‌بینی شدت آرتروز استفاده نشده است.
برخی از پژوهش‌ها به‌کارگیری روش‌های طبقه‌بندی ترتیبی و تحلیل تصاویر رادیوگرافی دوبعدی را پیشنهاد دادند [13، 14، 19]. در تحلیل داده‌های بیومکانیکی، رابطه میان شدت آرتروز و عوامل بالینی شامل سن، جنسیت، وزن، قد و شاخص توده بدنی نیز با استفاده از رگرسیون آماری و ضریب همبستگی پیرسون ارزیابی شد. از میان پارامترهای بررسی‌شده، حداقل ضخامت فضای مفصل، زاویه راستای مفصل و زاویه همگرایی بیشترین همبستگی آماری را با شدت آرتروز داشتند که با نتایج گزارش‌شده در پژوهش‌های [13، 19] همخوانی دارد. وزن نیز به‌عنوان یک عامل بالینی مؤثر، رابطه معناداری با پیشرفت آرتروز نشان داد، درحالی‌که شاخص توده بدنی به تنهایی شاخص پیش‌بینی‌کننده قابل‌اعتمادی نبود. این یافته با مطالعاتی مانند طارق و یوسف [14، 19] نیز تأیید می‌شود که اهمیت داده‌های ساختاری دقیق‌تر را نسبت به متغیرهای عمومی‌تر نشان داده‌اند. 
در مطالعه حاضر، برای نخستین‌بار اندازه‌گیری دقیق پارامترهای بیومکانیکی مفصل زانو شامل ضخامت فضای مفصل، زاویه راستای مفصل و زاویه همگرایی مفصل با استفاده از نرم‌افزار اودیا و بر روی مجموعه‌ای گسترده از داده‌ها و جامعه آماری بزرگ‌تر انجام شد. سپس، با استفاده از الگوریتم‌های مختلف یادگیری ماشین شامل نزدیک‌ترین همسایه، شبکه عصبی مصنوعی و مدل‌های کت‌بوست (در دو حالت باینری و چندمتغیره)، به بررسی رابطه میان این پارامترها و شدت آرتروز پرداخته شد. مدل جنگل تصادفی نیز به‌عنوان روش مقایسه‌ای برای طبقه‌بندی داده‌ها به‌کار گرفته شد. تحلیل مدل‌های یادگیری ماشین نیز نشان داد که در ارزیابی متغیرهای بالینی، مدل جنگل تصادفی عملکرد نسبتاً بهتری در شناسایی موارد آرتروز خفیف ارائه می‌دهد. بااین‌حال، بهترین نتایج در طبقه‌بندی مبتنی بر پارامترهای بیومکانیکی حاصل شد. 
به‌طور خاص، مدل کت‌بوست–باینری در تحلیل پارامترهای بیومکانیکی با دقت 82 درصد و مدل کت‌بوست–چندمتغیره با دقت 60 درصد و حساسیت 73 درصد، عملکرد بهینه‌ای در پیش‌بینی شدت آرتروز (به‌ویژه در درجات پایین‌تر کلگرن– لارنس) ارائه دادند. در تحلیل چندمتغیره، مدل کت‌بوست توانایی مناسبی در تشخیص آرتروز خفیف (درجات 0 و 1) داشت، اما در شناسایی موارد شدید (درجه 4)، دقت مدل به‌طور قابل‌توجهی کاهش یافت. این موضوع می‌تواند ناشی از توزیع نامتوازن داده‌ها، تعداد محدود نمونه در درجات بالای بیماری و تداخل ویژگی‌های ساختاری در سطوح پیشرفته آرتروز باشد. این موضوع می‌تواند به‌دلیل عدم توازن نمونه‌ها در این کلاس‌ها و همچنین پیچیدگی‌های ساختاری این سطوح باشد. مشابه این چالش‌ها در مطالعات مانند طارق و یوسف [14، 19]  نیز گزارش شده است.
همچنین، استفاده از مدل‌های ساده‌تر مانند KNN و ANN، عملکرد ضعیف‌تری در کلاس‌های نابرابر نشان دادند (دقت کمتر از 70 درصد)، که بر اهمیت انتخاب مدل مناسب متناسب با توزیع داده تأکید می‌کند.
مجموعه این نتایج نشان می‌دهد مدل‌های یادگیری ماشین، به‌ویژه کت‌بوست، می‌توانند ابزارهای قدرتمند و مؤثری برای تحلیل آماری و پیش‌بینی پیشرفت آرتروز زانو باشند. عملکرد بالای این مدل‌ها در پردازش پارامترهای بیومکانیکی که با دقت بالایی اندازه‌گیری شده‌اند می‌تواند کاربرد آن‌ها را در طراحی سیستم‌های تشخیص یاری‌رسان مبتنی بر تصویر و ارتقای ابزارهای تصمیم‌یار در کلینیک‌های ارتوپدی توجیه می‌کند. در نهایت، این مطالعه نشان داد استفاده هدفمند از داده‌های دقیق بیومکانیکی در کنار الگوریتم‌های یادگیری ماشین می‌تواند چشم‌اندازهای جدیدی را در زمینه ارزیابی، پایش و درمان بیماران مبتلا به آرتروز زانو فراهم سازد. بهبود فرایندهای آموزش مدل، گسترش مجموعه داده‌های آموزشی و به‌کارگیری تکنیک‌های بهینه‌سازی می‌تواند به افزایش دقت و کارایی این سیستم‌ها در کاربردهای بالینی آینده منجر شود.

نتیجه‌گیری
این مطالعه به‌طور جامع ارتباط بین متغیرهای بیومکانیکی و بالینی مفصل زانو با شدت آرتروز را تحلیل کرده و کارایی مدل‌های یادگیری ماشین را در پیش‌بینی این بیماری ارزیابی نموده است. نتایج نشان داد متغیرهایی مانند حداقل ضخامت فضای مفصل، زاویه راستای مفصل، زاویه همگرایی و وزن، با شدت آرتروز رابطه معناداری دارند، درحالی‌که سن، جنسیت و شاخص توده‌بدنی چنین ارتباطی نداشتند. این یافته‌ها بر اهمیت عوامل بیومکانیکی در مدیریت آرتروز و لزوم کنترل وزن تأکید دارند. همچنین ارتباط پارامترهای بیومکانیکی اندازه‌گیری شده، که برای اولین بار با دقت بالایی با نرم‌افزار اودیا انجام شده است، مورد ارزیابی قرار گرفت.
مدل کت‌بوست – باینری در تحلیل پارامترهای بیومکانیکی با دقت 82 درصد و مدل کت‌بوست–چندمتغیره با دقت 60 درصد و حساسیت 73 درصد، عملکرد بهینه‌ای در پیش‌بینی شدت آرتروز (به‌ویژه در درجات پایین‌تر کلگرن – لارنس) ارائه دادند. شایان ذکر است که در تحلیل چندمتغیره، مدل کت‌بوست توانایی مناسبی در تشخیص آرتروز خفیف (درجات 0 و 1) داشت، اما در شناسایی موارد شدید (درجه 4)، دقت مدل به‌طور قابل‌توجهی کاهش یافت. یافته‌ها نشان می‌دهند ترکیب داده‌های ساختاری مفصل با الگوریتم‌های پیشرفته یادگیری ماشین می‌تواند در ارتقاء تشخیص زودهنگام، پایش پیشرفت بیماری و بهینه‌سازی تصمیمات درمانی نقش مؤثری ایفا کند. 
به‌طورکلی، نتایج این تحقیق نشان می‌دهد مدل‌های یادگیری ماشین، به‌ویژه کت‌بوست، می‌توانند به‌عنوان ابزارهای مؤثر در تحلیل آماری داده‌های بیومکانیکی و پیش‌بینی شدت آرتروز زانو مورد استفاده قرار گیرند. ترکیب داده‌های ساختاری مفصل با الگوریتم‌های پیشرفته یادگیری ماشین امکان ارتقای فرایندهای تشخیص زودهنگام، پایش پیشرفت بیماری و بهینه‌سازی تصمیمات درمانی را فراهم می‌سازد.
یافته‌های این مطالعه می‌توانند گامی مؤثر در جهت توسعه سیستم‌های پشتیبان تصمیم‌گیری بالینی، طراحی ابزارهای غربالگری هوشمند و نیز بهبود راهکارهای درمانی برای بیماران مبتلا به آرتروز زانو فراهم آورند.

ملاحظات اخلاقی
پیروی از اصول اخلاق پژوهش

این مطالعه در دانشگاه بیرجند و با استفاده از داده‌های مطابق با پروتکل، اصول عملکرد بالینی (GCP)، اعلامیه هلسینکی و الزامات نظارتی اخلاقی و قانونی قابل‌اجرا (برای همه کشورهای درگیر) انجام می‌شود و با شماره (clinicaltrials.gov: NCT03883568) ثبت شده است. همه شرکت‌کنندگان اطلاعات شفاهی و کتبی دریافت کرده و رضایت‌نامه کتبی آگاهانه ارائه داده‌اند. 

حامی مالی
این مقاله برگرفته از پایان‌نامه آقای علی بهرامیان گروه پژوهشی ارتوپدی-بیومکانیک، گروه مهندسی مکانیک، دانشگاه بیرجند می‌باشد. 

مشارکت نویسندگان
تحلیل‌های آماری: علی بهرامیان؛ روش‌های یادگیری ماشین و پیش‌نویس مقاله: وحید اربابی؛  نظارت و بازبینی‌های علمی و اساسی: مهدی راغبی.

تعارض منافع
بنابر اظهار نویسندگان، این مقاله تعارض منافع ندارد. 

تشکر و قدردانی
از تمامی شرکت‌کنندگانی که در این مطالعه حضور داشتند، تشکر و قدردانی می‌شود.

 

References

  1. Sarvazyan A, Hall TJ, Urban MW, Fatemi M, Aglyamov SR, Garra BS. An overview of elastography - an emerging branch of medical imaging. Current Medical Imaging Reviews. 2011; 7(4):255-82. [DOI:10.2174/157340511798038684] [PMID]
  2. Cherian JJ, Kapadia BH, Banerjee S, Jauregui JJ, Issa K, Mont MA. Mechanical, anatomical, and kinematic axis in TKA: Concepts and practical applications. Current Reviews in Musculoskeletal Medicine. 2014; 7(2):89-95. [DOI:10.1007/s12178-014-9218-y][PMID]
  3. Evans RC. Antropometri. In: Illustrated Orthopedic Physical Assessment. Mosby: Elsevier Inc; 2009. [Link]
  4. Flandry F, Hommel G. Normal anatomy and biomechanics of the knee. Sports Medicine and Arthroscopy Review. 2011; 19(2):82-92. [DOI:10.1097/JSA.0b013e318210c0aa][PMID]
  5. Cui A, Li H, Wang D, Zhong J, Chen Y, Lu H. Global, regional prevalence, incidence and risk factors of knee osteoarthritis in population-based studies. EClinicalMedicine. 2020; 29-30:100587. [DOI:10.1016/j.eclinm.2020.100587][PMID]
  6. Safiri S, Kolahi AA, Smith E, Hill C, Bettampadi D, Mansournia MA, et al. Global, regional and national burden of osteoarthritis 1990-2017: A systematic analysis of the Global Burden of Disease Study 2017. Annals of The Rheumatic Diseases. 2020; 79(6):819-28. [DOI:10.1136/annrheumdis-2019-216515][PMID]
  7. Shamsi M, Safari A, Soroush A, Safari Y. The Survey of Knee Osteoarthritis in the Population over Age 50 Visited in the Health Bus in Kermanshah, Iran. Journal of Aging Research. 2021; 2021:9809565. [DOI:10.1155/2021/9809565][PMID]
  8. Menkes CJ. Radiographic criteria for classification of osteoarthritis. The Journal of Rheumatology. 1991; Suppl 27:13-5. [PMID]
  9. Gay C, Chabaud A, Guilley E, Coudeyre E. Educating patients about the benefits of physical activity and exercise for their hip and knee osteoarthritis. Systematic literature review. Annals of Physical and Rehabilitation Medicine. 2016; 59(3):174-83. [DOI:10.1016/j.rehab.2016.02.005][PMID]
  10. Sellam J, Berenbaum F. The role of synovitis in pathophysiology and clinical symptoms of osteoarthritis. Nature Reviews. Rheumatology. 2010; 6(11):625-35. [DOI:10.1038/nrrh2010.159][PMID]
  11. Marijnissen AC, Vincken KL, Vos PA, Saris DB, Viergever MA, Bijlsma JW, et al. Knee Images Digital Analysis (KIDA): A novel method to quantify individual radiographic features of knee osteoarthritis in detail. Osteoarthritis and Cartil 2008; 16(2):234-43. [PMID]
  12. Rayegan H, Nguyen HC, Weinans H, Gielis WP, Ahmadi Brooghani SY, Custers RJH, et al. Automated radiographic measurements of knee osteoarthritis. Cartilage. 2023; 14(4):413-23. [DOI:10.1177/19476035231166126][PMID]
  13. Brejnebøl MW, Hansen P, Nybing JU, Bachmann R, Ratjen U, Hansen IV, et al. External validation of an artificial intelligence tool for radiographic knee osteoarthritis severity classification. European Journal of Radiology. 2022; 150:110249. [DOI:10.1016/j.ejrad.110249][PMID]
  14. Tariq T, Suhail Z, Nawaz Z. Knee osteoarthritis detection and classification using X-rays. IEEE Access. 2023; 11:48292-303. [DOI:10.1109/ACCESS.2023.3276810]
  15. Mehta N, Duryea J, Badger GJ, Akelman MR, Jones MH, Spindler KP, et al. Comparison of 2 radiographic techniques for measurement of tibiofemoral joint space width. Orthopaedic Journal of Sports Medicine. 2017; 5(9):2325967117728675. [DOI:10.1177/2325967117728675] [PMID]
  16. Buckland-Wright JC, Macfarlane DG, Lynch JA, Jasani MK, Bradshaw CR. Joint space width measures cartilage thickness in osteoarthritis of the knee: High resolution plain film and double contrast macroradiographic investigation. Annals of The Rheumatic Diseases. 1995; 54(4):263-8. [DOI:10.1136/ard.54.4.263][PMID]
  17. Ratzlaff C, Lynch JA, Lu B, Duryea J. The longitudinal relationship between alignment and joint space width: Data from the Osteoarthritis Initiative (OAI). Osteoarthritis and Cartilage. 2013; 21(Suppl):S173-4. [Link]
  18. Kotti M, Duffell LD, Faisal AA, McGregor Detecting knee osteoarthritis and its discriminating parameters using random forests. Medical Engineering & Physics. 2017; 43:19-29. [DOI:10.1016/j.medengphy.2017.02.004][PMID]
  19. Joseph GB, McCulloch CE, Nevitt MC, Link TM, Sohn JH. Machine learning to predict incident radiographic knee osteoarthritis over 8 years using combined MR imaging features, demographics, and clinical factors: Data from the Osteoarthritis Initiative. Osteoarthritis and Cartilage. 2022; 30(2):270-9. [DOI:10.1016/j.joca.2021.11.007][PMID]
  20. Janvier T, Jennane R, Toumi H, Lespessailles E. Subchondral tibial bone texture predicts the incidence of radiographic knee osteoarthritis: Data from the Osteoarthritis Initiative. Osteoarthritis and Cartilage. 2017; 25(12):2047-54. [DOI:10.1016/j.joca.2017.09.004][PMID]
  21. van Helvoort EM, Jansen MP, Marijnissen ACA, Kloppenburg M, Blanco FJ, Haugen IK, et al. Predicted and actual 2-year structural and pain progression in the IMI-APPROACH knee osteoarthritis cohort. Rheumatology (Oxford). 2022; 62(1):147-57. [DOI:10.1093/rheumatology/keac292][PMID]
  22. Cootes TF, Ionita MC, Lindner C, Sauer P. Robust and accurate shape model fitting using random forest regression voting. Paper presented at: 12th European Conference on Computer Vision, ECCV. 1 Jul 2012 ; Florence, Italy. [Link]
  23. Cleophas TJ, Zwinderman AH. Machine Learning in Medicine - A Complete Overview. Cham: Springer; 2020. [DOI:10.1007/978-3-030-33970-8]
  24. Bishop CM. Pattern Recognition and Machine Learning. Singapore: Springer; 2021. [Link]
  25. Gubbi S, Hamet P, Tremblay J, Koch CA, Hannah-Shmouni F. Artificial intelligence and machine learning in endocrinology and metabolism: The dawn of a new era. Frontiers in Endocrinology. 2019; 10:185. [DOI:10.3389/fendo.2019.00185][PMID]

 

  1. References

    1. Sarvazyan A, Hall TJ, Urban MW, Fatemi M, Aglyamov SR, Garra BS. An overview of elastography - an emerging branch of medical imaging. Current Medical Imaging Reviews. 2011; 7(4):255-82. [DOI:10.2174/157340511798038684] [PMID]
    2. Cherian JJ, Kapadia BH, Banerjee S, Jauregui JJ, Issa K, Mont MA. Mechanical, anatomical, and kinematic axis in TKA: Concepts and practical applications. Current Reviews in Musculoskeletal Medicine. 2014; 7(2):89-95. [DOI:10.1007/s12178-014-9218-y][PMID]
    3. Evans RC. Antropometri. In: Illustrated Orthopedic Physical Assessment. Mosby: Elsevier Inc; 2009. [Link]
    4. Flandry F, Hommel G. Normal anatomy and biomechanics of the knee. Sports Medicine and Arthroscopy Review. 2011; 19(2):82-92. [DOI:10.1097/JSA.0b013e318210c0aa][PMID]
    5. Cui A, Li H, Wang D, Zhong J, Chen Y, Lu H. Global, regional prevalence, incidence and risk factors of knee osteoarthritis in population-based studies. EClinicalMedicine. 2020; 29-30:100587. [DOI:10.1016/j.eclinm.2020.100587][PMID]
    6. Safiri S, Kolahi AA, Smith E, Hill C, Bettampadi D, Mansournia MA, et al. Global, regional and national burden of osteoarthritis 1990-2017: A systematic analysis of the Global Burden of Disease Study 2017. Annals of The Rheumatic Diseases. 2020; 79(6):819-28. [DOI:10.1136/annrheumdis-2019-216515][PMID]
    7. Shamsi M, Safari A, Soroush A, Safari Y. The Survey of Knee Osteoarthritis in the Population over Age 50 Visited in the Health Bus in Kermanshah, Iran. Journal of Aging Research. 2021; 2021:9809565. [DOI:10.1155/2021/9809565][PMID]
    8. Menkes CJ. Radiographic criteria for classification of osteoarthritis. The Journal of Rheumatology. 1991; Suppl 27:13-5. [PMID]
    9. Gay C, Chabaud A, Guilley E, Coudeyre E. Educating patients about the benefits of physical activity and exercise for their hip and knee osteoarthritis. Systematic literature review. Annals of Physical and Rehabilitation Medicine. 2016; 59(3):174-83. [DOI:10.1016/j.rehab.2016.02.005][PMID]
    10. Sellam J, Berenbaum F. The role of synovitis in pathophysiology and clinical symptoms of osteoarthritis. Nature Reviews. Rheumatology. 2010; 6(11):625-35. [DOI:10.1038/nrrh2010.159][PMID]
    11. Marijnissen AC, Vincken KL, Vos PA, Saris DB, Viergever MA, Bijlsma JW, et al. Knee Images Digital Analysis (KIDA): A novel method to quantify individual radiographic features of knee osteoarthritis in detail. Osteoarthritis and Cartil 2008; 16(2):234-43. [PMID]
    12. Rayegan H, Nguyen HC, Weinans H, Gielis WP, Ahmadi Brooghani SY, Custers RJH, et al. Automated radiographic measurements of knee osteoarthritis. Cartilage. 2023; 14(4):413-23. [DOI:10.1177/19476035231166126][PMID]
    13. Brejnebøl MW, Hansen P, Nybing JU, Bachmann R, Ratjen U, Hansen IV, et al. External validation of an artificial intelligence tool for radiographic knee osteoarthritis severity classification. European Journal of Radiology. 2022; 150:110249. [DOI:10.1016/j.ejrad.110249][PMID]
    14. Tariq T, Suhail Z, Nawaz Z. Knee osteoarthritis detection and classification using X-rays. IEEE Access. 2023; 11:48292-303. [DOI:10.1109/ACCESS.2023.3276810]
    15. Mehta N, Duryea J, Badger GJ, Akelman MR, Jones MH, Spindler KP, et al. Comparison of 2 radiographic techniques for measurement of tibiofemoral joint space width. Orthopaedic Journal of Sports Medicine. 2017; 5(9):2325967117728675. [DOI:10.1177/2325967117728675] [PMID]
    16. Buckland-Wright JC, Macfarlane DG, Lynch JA, Jasani MK, Bradshaw CR. Joint space width measures cartilage thickness in osteoarthritis of the knee: High resolution plain film and double contrast macroradiographic investigation. Annals of The Rheumatic Diseases. 1995; 54(4):263-8. [DOI:10.1136/ard.54.4.263][PMID]
    17. Ratzlaff C, Lynch JA, Lu B, Duryea J. The longitudinal relationship between alignment and joint space width: Data from the Osteoarthritis Initiative (OAI). Osteoarthritis and Cartilage. 2013; 21(Suppl):S173-4. [Link]
    18. Kotti M, Duffell LD, Faisal AA, McGregor Detecting knee osteoarthritis and its discriminating parameters using random forests. Medical Engineering & Physics. 2017; 43:19-29. [DOI:10.1016/j.medengphy.2017.02.004][PMID]
    19. Joseph GB, McCulloch CE, Nevitt MC, Link TM, Sohn JH. Machine learning to predict incident radiographic knee osteoarthritis over 8 years using combined MR imaging features, demographics, and clinical factors: Data from the Osteoarthritis Initiative. Osteoarthritis and Cartilage. 2022; 30(2):270-9. [DOI:10.1016/j.joca.2021.11.007][PMID]
    20. Janvier T, Jennane R, Toumi H, Lespessailles E. Subchondral tibial bone texture predicts the incidence of radiographic knee osteoarthritis: Data from the Osteoarthritis Initiative. Osteoarthritis and Cartilage. 2017; 25(12):2047-54. [DOI:10.1016/j.joca.2017.09.004][PMID]
    21. van Helvoort EM, Jansen MP, Marijnissen ACA, Kloppenburg M, Blanco FJ, Haugen IK, et al. Predicted and actual 2-year structural and pain progression in the IMI-APPROACH knee osteoarthritis cohort. Rheumatology (Oxford). 2022; 62(1):147-57. [DOI:10.1093/rheumatology/keac292][PMID]
    22. Cootes TF, Ionita MC, Lindner C, Sauer P. Robust and accurate shape model fitting using random forest regression voting. Paper presented at: 12th European Conference on Computer Vision, ECCV. 1 Jul 2012 ; Florence, Italy. [Link]
    23. Cleophas TJ, Zwinderman AH. Machine Learning in Medicine - A Complete Overview. Cham: Springer; 2020. [DOI:10.1007/978-3-030-33970-8]
    24. Bishop CM. Pattern Recognition and Machine Learning. Singapore: Springer; 2021. [Link]
    25. Gubbi S, Hamet P, Tremblay J, Koch CA, Hannah-Shmouni F. Artificial intelligence and machine learning in endocrinology and metabolism: The dawn of a new era. Frontiers in Endocrinology. 2019; 10:185. [DOI:10.3389/fendo.2019.00185][PMID]

     

Volume 14, Issue 5
November and December 2025
Pages 804-823
  • Receive Date: 24 June 2025
  • Revise Date: 09 August 2025
  • Accept Date: 19 August 2025
  • First Publish Date: 19 August 2025