Document Type : Original article
Authors
Department of Mechanical Engineering, Orthopaedic-BioMechanic Research Group, Faculty of Engineering, University of Birjand, Birjand, Iran.
Abstract
Keywords
Main Subjects
Introduction
Knee osteoarthritis (OA) is a chronic, progressive joint disorder affecting a significant portion of the aging population. It is characterized by cartilage degradation, leading to joint pain, stiffness, and impaired mobility. Traditional diagnostic methods often detect OA in advanced stages, limiting opportunities for early intervention. Several clinical factors, such as obesity, age, genetic predisposition, and skeletal deformities (e.g. varus/valgus knees), contribute to OA progression. Moreover, biomechanical parameters extracted from radiographic images correlate with disease severity. With the advent of artificial intelligence (AI), machine learning (ML) offers new avenues for early OA diagnosis and severity prediction by analyzing the complex interactions between clinical and biomechanical data.
Methods
Data set: This study was based on a follow-up of participants in the APPROACH cohort (mean age: 66.5 years), all of whom experienced knee pain. Image processing: Bone boundaries were detected using BoneFinder (University of Manchester), biomechanical parameters, joint space width (JSW), femoral-tibial angle (FTA), and joint line convergence angle (JLCA), as well as clinical variables, such as weight, height, body mass index (BMI), age, and gender were measured. were extracted via ODEA (University of Birjand).
Image Processing: Bone boundaries were detected using the random forest technique, and biomechanical parameters such as JSW, FTA, and JLCA, as well as clinical variables like weight, height, BMI, age, and gender, were measured. These variables were extracted using the ODIA software developed at the University of Birjand.
Modeling: AI and ML techniques were employed to extract bone boundaries from radiographic images of the knee joint. Biomechanical parameters such as JSW, FTA, and JLCA, along with clinical variables like weight, height, BMI, age, and gender, were measured. The ML models used in this study included K-nearest neighbors (KNN), artificial neural network (ANN), binary CatBoost, multiclass CatBoost, and Random Forest classifiers, which were used in statistical analysis to explore the relationship between these variables and osteoarthritis severity. Statistical regression and Pearson correlation coefficient analyses were performed to evaluate the data.
Sampling method and data splitting
For data sampling and analysis, ML methods including K-Nearest Neighbors (KNN), artificial neural networks (ANN), and two CatBoost models (binary and multivariate), were implemented in the Python environment. To split the data into training and testing sets, binary classification models and stratified Random Forest classifiers were applied to ensure a balanced distribution of osteoarthritis severity levels (based on the Kellgren–Lawrence scale). To address class imbalance in the dataset, oversampling was performed using the synthetic minority over-sampling technique within the Python environment, utilizing the imbalanced-learn library. Software and Libraries used for sampling and analysis:
Python
Scikit-learn, imbalanced-learn, and pandas libraries for data splitting and preprocessing.
Results
The results showed that minimum JSW, FTA, JLCA, and weight had significant effects on OA progression. The binary CatBoost model achieved 82% accuracy, and the multiclass CatBoost model demonstrated 60% accuracy with 73% sensitivity for identifying mild OA cases based on biomechanical parameters. Additionally, the Random Forest classification framework within CatBoost achieved an overall accuracy of 54% and showed better performance in analyzing clinical parameters compared to other models.
Conclusion
This study confirms the potential of ML-based approaches. ML models, particularly CatBoost and Random Forest, demonstrate promising performance in predicting and evaluating knee OA progression. These findings highlight the potential of ML techniques as supportive tools in clinical decision-making for OA diagnosis and monitoring.
Ethical Considerations
Compliance with ethical guidelines
This study was conducted at Birjand University using data collected in compliance with the protocol, Good Clinical Practice, the Declaration of Helsinki, and applicable ethical and legal regulatory requirements (for all countries involved), and is registered under clinicaltrials.gov nr: NCT03883568. All participants received oral and written information and provided written informed consent.
Funding
This article was extracted from the dissertation of Ali Bahramian at the Orthopedic-Biomechanics Research Group, Department of Mechanical Engineering, University of Birjand.
Authors' contributions
Statistical analysis: Ali Bahramian; Drafting the manuscript: Vahid Arbabi.
Conflict of interest
The authors declared no conflicts of interest.
Acknowledgments
The authors would like to thank all participants for their cooperation in this study.
مقدمه و اهداف
امروزه رادیوگرافی بهعنوان یکی از ابزارهای کلیدی در تشخیص بیماریهای مفصل زانو، بهویژه آرتروز، شناخته میشود [1]. مفصل زانو، استخوانهای ران و درشتنی را به هم متصل میکند، از پیچیدهترین و حیاتیترین مفاصل بدن است و بهدلیل تحمل فشارهای زیاد و دامنه حرکتی بالا، مستعد آسیبهایی نظیر درد، ساییدگی و تخریب بافتهای سخت میباشد [2]. آرتروز زانو بیماری مزمن و پیشروندهای است که با تخریب غضروف مفصلی و ایجاد درد و محدودیت حرکتی همراه است. این وضعیت معمولاً بر اثر فعالیتهایی که فشار زیادی بر مفصل وارد میکنند، شدت میگیرد [3، 4].
براساس یک مرور نظاممند و فراتحلیل شامل 88 مطالعه، شیوع جهانی آرتروز زانو در افراد بالای 40 سال حدود 22/9 درصد گزارش شده است که معادل تقریباً 654 میلیون نفر در سال 2020 برآورد میشود [5]. همچنین نتایج مطالعهای دیگر نشان میدهد شیوع جهانی آرتروز زانو 4376 مورد به ازای هر 100٬000 نفر (معادل 4/38 درصد) بوده است و این میزان در فاصله سالهای 1990 تا 2019، افزایش 7/5 درصدی داشته است [6]. در ایران، مطالعهای در شهر کرمانشاه بر روی افراد بالای 50 سال نشان داد 39/5 درصد از زنان و 38/6 درصد از مردان سابقه درد زانو داشتهاند که بیانگر شیوع بالای آرتروز زانو در این گروه سنی است [7]. برای ارزیابی شدت بیماری، معیار کلگرن - لارنس (KL) که بر پایه تصاویر رادیوگرافی است، کاربرد دارد. این معیار، شدت آسیب غضروفی را در 5 درجه (از 0 تا 4) طبقهبندی میکند، بهطوریکه درجه صفر نشاندهنده مفصل سالم و درجه 4 بیانگر آرتروز شدید است [8]. برای کنترل پیشرفت آرتروز و بهبود عملکرد مفصل زانو، روشهایی نظیر آموزش، ورزشدرمانی، کاهش وزن و مصرف داروهای مُسکِن بهکار میرود [9]. عضلات اطراف زانو نقش مهمی در ثبات بیومکانیکی این مفصل دارند و ضعف آنها میتواند 4 به افزایش فشار، تغییر شکل استخوان و ایجاد زائدههای استخوانی منجر شود [10].
باتوجهبه اهمیت روزافزون تشخیص و پیشگری زودهنگام آرتروز زانو، پژوهشهای متعددی به بررسی آن از دیدگاههای گوناگون پرداختهاند. اندازهگیری دقیق مرزهای استخوانی و پارامترهای مفصلی در تحلیل پیشرفت بیماری، نقشی کلیدی دارد.
مطالعه ماریجنیسن و همکاران [11] با استفاده از نرمافزار کیدا (KIDA) اندازهگیریهای دستی دقیقی از مفصل انجام شده است که با بهرهگیری از پردازش تصویر و مرزهای استخوانی، دادههایی قابلاطمینان فراهم شده است. رایگان و همکاران [12] با بهرهگیری از نرمافزار بونفایندر و اودیا، برای نخستین بار روشی دقیق و خودکار را برای استخراج پارامترهای آناتومیکی و مفصلی معرفی کردند. ماتیاس و همکاران [13]، نیز از شبکه عصبی کانولوشنال برای طبقهبندی شدت آرتروز براساس تصاویر رادیوگرافی استفاده کردند، هرچند نمونههای محدود این مطالعه، دقت کلی نتایج را تحت تأثیر قرار داد. در نهایت، طیبه طارق و همکاران [14] از الگوریتم یادگیری عمیق و طبقهبندی ترتیبی برای تشخیص دقیقتر شدت آرتروز استفاده کردند تا روند بیماری بهدرستی در نظر گرفته شود.
روشهای گوناگونی در راستای اندازهگیری پارامترهای مفصل زانو ارائه شده است. ضخامت فضای مفصل با استفاده از روش نقطه میانی و نرمافزار متلب اندازهگیری شد [15]. ضخامت فضای مفصل (JSW) را با استفاده از رادیوگرافی میکروکانونی با وضوح بالا بررسی کردند [16]. تغییرات ضخامت فضای مفصل و زاویه بین استخوانهای ران و درشتنی (FTA) با درجه آرتروز و همترازی استخوانها بررسی شد [17]. همچنین روشهای متفاوتی در راستای بررسی ارتباط میزان شدت آرتروز با پارامترهای بالینی و بیومکانیکی ارائه شده است. از جمله، با استفاده از الگوریتم رگرسیون جنگل تصادفی (RF)، ارتباط متغیرهایی چون سن، جنسیت و شاخص توده بدنی را با روند پیشرفت آرتروز بررسی گردید [18]. با استفاده از تصویربرداری مغناطیسی (WORMS) و الگوریتمهای یادگیری ماشین، روند پیشرفت آرتروز طی 8 سال بررسی شد [19]. با بهکارگیری رگرسیون لجستیک، تأثیر عوامل بالینی مانند سن، جنس و شاخص توده بدنی را در پیشبینی درجه کلگرن – لارنس ارزیابی گردید [20].
در بیشتر مطالعات پیشین، اندازهگیریها بهصورت دستی و بر پایه روشهای ساده هندسی انجام شده است که این امر باعث کاهش دقت و نادیده گرفتن بخشهایی از آناتومی مفصل شده است. افزون بر این، محدودیت در حجم داده و تعداد شرکتکنندگان باعث کاهش تعمیمپذیری نتایج شده است. بررسی جامع ارتباط بین پارامترهای بیومکانیکی (نظیر ضخامت فضای مفصل و زاویه مفصل) و ویژگیهای بالینی (سن، جنس و شاخص توده بدنی) نیز اغلب بهصورت موردی و محدود صورت گرفته است.
با وجود استفاده از نرمافزار اودیا در مطالعات پیشین، تاکنون تحلیل آماری شدت آرتروز براساس دادههای این نرمافزار با مدلهای یادگیری ماشین مانند نزدیکترین همسایه (KNN)، شبکه عصبی مصنوعی (ANN) و کتبوست بهطور جامع بررسی نشده است. در این پژوهش، با بهرهگیری از نرمافزار اودیا [12]، متغیرهایی چون ضخامت فضای مفصل، زاویه راستای مفصل و زاویه همگرایی در مجموعه دادهای بزرگتر و با تعداد نمونه بیشتر و دقت بالا اندازهگیری شد. سپس برای نخستین بار، تحلیل آماری و ارتباط این پارامترهای بیومکانیکی با شدت آرتروز با استفاده از مدلهای یادگیری ماشین مذکور مورد تحلیل قرار گرفت. همچنین، ارتباط شدت آرتروز با پارامترهای بالینی نظیر سن، جنس، وزن، قد و شاخص توده بدنی با استفاده از تحلیل آماری رگرسیون و ضریب همبستگی پیرسون بررسی شد.
هدف اصلی این پژوهش، تحلیل آماری و پیشبینی شدت آرتروز زانو از طریق دادههای بیومکانیکی و بالینی با استفاده از روشهای یادگیری ماشین میباشد.
مواد و روشها
این مطالعه از دادههای پروژه کنسرسیوم اروپایی (APPROACH) بر روی 297 بیمار با میانگین سنی 66/5 سال که در هنگام ورود به مطالعه حداقل به مدت 2 سال علائم درد در ناحیه مفصل زانو را گزارش داده بودند، انجام شد. تصاویر رادیوگرافی با استفاده از روشهای استاندارد شامل تصویربرداری خمش-ثابت و خلفی-قدامی جمعآوری شدند (تصویر شماره 1) [21].
ابتدا، مرزهای استخوانی مفصل زانو از تصاویر رادیوگرافی استخراج شدند. این فرآیند با استفاده از نرمافزار بونفایندر که بر پایه الگوریتمهای یادگیری ماشین و بهویژه مدل جنگل تصادفی عمل میکند، انجام شد. سپس، متغیرهای بیومکانیکی مفصل زانو شامل ضخامت فضای مفصل، زاویه راستای مفصل و زاویه همگرایی، با استفاده از نرمافزار اودیا (مبتنی بر برنامهنویسی متلب) اندازهگیری شدند [12].
برای نمونهگیری و تحلیل دادهها، از روشهای یادگیری ماشین شامل نزدیکترین همسایه، شبکه عصبی مصنوعی و دو مدل کتبوست « شامل مدلهای باینری و چندمتغیره » در محیط نرمافزار پایتون استفاده شد.
بهمنظور تقسیم دادهها به مجموعههای آموزش و آزمون، از روشهای مدل طبقهبندی باینری و جنگل تصادفی بهصورت طبقهبندیشده استفاده شد تا توزیع متعادلی از درجات مختلف آرتروز براساس مقیاس کلگرن-لارنس در دادهها حفظ گردد. همچنین، بهمنظور مقابله با عدم توازن بین کلاسها، از تکنیک نمونهبرداری بیش از حد با استفاده از روش بیشنمونهسازی مصنوعی اقلیت در محیط پایتون و با بهرهگیری از کتابخانه عدم تعادل- یادگیری استفاده شد.
- نرمافزارها و کتابخانههای مورد استفاده برای نمونهگیری و تحلیل دادهها شامل موارد زیر بودند:
- نرمافزار پایتون
- کتابخانههای اسکیت، عدم تعادل و پانداس برای تقسیم دادهها، پیشپردازش و یادگیری ماشین.
برای انجام تحلیل آماری، ارتباط بین پیشرفت آرتروز و پارامترهای مختلف مورد بررسی قرار گرفت. این پارامترها شامل 17 متغیر بیومکانیکی (حداقل ضخامت فضای مفصل پای چپ، حداکثر ضخامت فضای مفصل پای چپ، حداقل ضخامت فضای مفصل پای راست، حداکثر ضخامت فضای مفصل پای راست، زاویه راستای مفصل پای چپ، زاویه راستای مفصل پای راست، زاویه همگرایی مفصل پای چپ، زاویه همگرایی مفصل پای راست، حداقل ضخامت فضای مفصل در قسمت خارجی، حداکثر ضخامت فضای مفصل در قسمت خارجی، میانگین ضخامت فضای مفصل قسمت خارجی، حداقل ضخامت فضای مفصل در قسمت داخلی، حداکثر ضخامت فضای مفصل در قسمت داخلی، میانگین ضخامت فضای مفصل قسمت داخلی، میانگین کل ضخامت فضای مفصل، زاویه همگرایی در پایینترین نقطه مفصل پای راست، زاویه همگرایی در پایینترین نقطه مفصل پای چپ) و متغیرهای بالینی مانند جنسیت، وزن، قد، شاخص توده بدنی و سن بودند.
به منظور تحلیل دادهها، از روشهای یادگیری ماشین مانند نزدیکترین همسایه، شبکه عصبی مصنوعی و دو مدل کتبوست « شامل مدلهای باینری (CB) و چندمتغیره (MC) » استفاده شد. همچنین، برای انجام طبقهبندی، از مدل جنگل تصادفی نیز بهره گرفته شد.
روش الگوریتم جنگل تصادفی برای تعیین مرز استخوان مفصل زانو
الگوریتم جنگل تصادفی، الگوریتمی یادگیری نظارتشده محسوب میشود. در این مطالعه برای شناسایی و استخراج دقیق مرزهای استخوانی مفصل زانو به کار گرفته شد. این الگوریتم با ترکیب نتایج حاصل از چندین درخت تصمیم، پیشبینیهای قابلاعتمادی ارائه میدهد. هر درخت تصمیم در این الگوریتم، بر روی زیرمجموعهای تصادفی از دادههای آموزشی و نیز زیرمجموعهای تصادفی از ویژگیها، آموزش داده میشود. سپس، خروجی نهایی جنگل تصادفی از طریق تجمیع نتایج همه درختهای تصمیم (مثلاً با رأی اکثریت در مسائل طبقهبندی یا میانگینگیری در مسائل رگرسیون) تعیین میشود [22].
یکی از ویژگیهای برجسته این روش، مقاومت بالای آن در برابر مشکل بیشبرازش است. بیشبرازش، یکی از چالشهای رایج در یادگیری ماشین است که در آن، مدل بر دادههای آموزشی بهشدت تنظیم میشود و در نتیجه، عملکرد ضعیفی بر روی دادههای جدید از خود نشان میدهد. الگوریتم جنگل تصادفی با استفاده از مکانیسم تجمعی و تصادفیسازی، این مشکل را بهطور مؤثری کاهش میدهد [22].
در این پژوهش، نقاط آناتومیکی کلیدی استخوانهای مفصل زانو ابتدا بهصورت دستی توسط متخصصین شناسایی و جانمایی شدند. این نقاط بهعنوان دادههای ورودی برای آموزش نرمافزار بونفایندر استفاده شدند. این نرمافزار با بهرهگیری از روشهای یادگیری ماشین و اجرای الگوریتم جنگل تصادفی، قادر به استخراج خودکار مرزهای استخوانی مفصل زانو شد. نتایج حاصل از این فرآیند نشاندهنده دقت و کارایی بالای الگوریتم در تشخیص و استخراج دقیق مرزهای استخوانی بود که در تصویر شماره 2 نمایش داده شده است.
این رویکرد، علاوهبر کاهش خطاهای انسانی در مرحله شناسایی دستی، زمان موردنیاز برای پردازش دادهها را نیز بهطور قابلتوجهی کاهش داد.
اندازهگیری متغیرهای مفصل زانو
ارزیابی دقیق پارامترهای بیومکانیکی مفصل زانو، نقش کلیدی در تشخیص و پیشبینی میزان پیشرفت آرتروز دارد. در این پژوهش، از نرمافزار اودیا برای اندازهگیری پارامترهای ضخامت فضای مفصل، زاویه استخوان درشتنی و زاویه همگرایی مفصل (JLCA)، استفاده شد. در ادامه، روش محاسبه هر کدام تشریح شده است [12].
اندازهگیری ضخامت فضای مفصل
برای محاسبه ضخامت مفصل، همانطور که در (تصویر شماه 3) نشان داده شده است.
مرزی مشخص تعیین شد که فاصله آن معادل 15/2 فاصله بین نقاط شماره 7 و 26 در دو کناره مفصل در نظر گرفته شد. طول این خط که معادل 20/3 فاصله کل بین این دو نقطه است، بهعنوان پایهای برای محاسبه ضخامت مفصل استفاده شد. علاوهبراین، از دایرههایی که بهصورت مماس بر لبههای استخوانهای تشکیلدهنده فضای مفصل قرار گرفتهاند، برای اندازهگیری دقیقتر ضخامت فضای مفصل استفاده شد. قطر بزرگترین و کوچکترین دایرههای مماس بهترتیب نشاندهنده حداکثر و حداقل ضخامت فضای مفصل هستند. این دایرهها فاصله عمودی بین دو استخوان تشکیلدهنده مفصل را اندازهگیری میکنند که باعث میشود روش محاسبه ضخامت فضای مفصل با استفاده از این روش، نسبت به روشهای سنتی، دقت بیشتری داشته باشد [11]. این رویکرد نهتنها بهدلیل استفاده از الگوریتمهای دقیق برای تخمین فاصله بین استخوانها، بلکه بهدلیل لحاظ کردن تغییرات محلی در ضخامت مفصل، از اهمیت ویژهای برخوردار است [12]. تصویر شماه 3 نحوه استفاده از این دایرهها و خطوط مرجع را برای محاسبه ضخامت فضای مفصل نشان میدهد.
اندازهگیری زاویه راستای مفصل
زاویه راستای مفصل با استفاده از تعیین دو محور آناتومیکی استخوانهای ران (فمور) و ساق پا (درشتنی) محاسبه گردید. برای استخراج محور آناتومیکی استخوان فمور، خطی از مرکز سر استخوان ران تا نقطه آناتومیکی شماره 69 ترسیم شد. در مورد استخوان درشتنی، محور آناتومیکی از طریق میانگین خط واصل دو نقطه آناتومیکی شماره 15 و 19، واقع در ناحیه انتهایی دیافیز این استخوان، تعیین شد [12].
بهمنظور افزایش دقت در تعیین این محورها، از روشی مکمل نیز استفاده شد. در این روش، دایرههایی بر مسیر انحنای مرزهای استخوانهای فمور و درشتنی مماس شده و مرکز هندسی این دایرهها بهعنوان نقاط مرجع جهت تعریف دقیقتر محورهای آناتومیک بهکار رفتهاند [12]. این روش امکان اصلاح یا تقویت برآورد اولیه محورها را فراهم کرده و در مواردی که انحنا یا تغییر شکل در استخوانها مشاهده میشود، عملکرد قابلاعتمادتری ارائه میدهد. زاویه راستای مفصل که از تلاقی این دو محور بهدست میآید، یکی از متغیرهای کلیدی در تحلیل راستای اندام تحتانی محسوب میشود و نقش مهمی در ارزیابی وضعیت بیومکانیکی زانو ایفا میکند. انحراف از مقادیر نرمال این زاویه ممکن است نمایانگر تغییرات آسیبشناختی در ساختار مفصل باشد. تصویر شماره 4 روند دقیق ترسیم محورهای آناتومیکی و نحوه محاسبه زاویه راستای مفصل را نشان میدهد.
اندازهگیری زاویه همگرایی مفصل
زاویه همگرایی مفصل زانو در این مطالعه با استفاده از نرمافزار اودیا محاسبه شد. برای تعیین این زاویه، ابتدا دو خط مرجع به نامهای L2 و L3 بر اساس موقعیتهای آناتومیکی مشخصشده روی مرز استخوانها تعریف شدند. خط L2 نمایانگر راستای کندیلهای استخوان فمور است و از نقاط شماره 63 تا 68 در بخش داخلی (مدیال) و نقاط 70 تا 75 در بخش خارجی (لترال) این استخوان عبور میکند. این خط بیانگر راستای سطح مفصلی استخوان ران در نمای رادیوگرافی است. خط L3 نیز بهمنظور نمایش راستای سطح پلاتوی استخوان درشتنی ترسیم شده و از نقاط شماره 9 تا 13 در سمت مدیال و 20 تا 25 در سمت لترال تیبیال عبور میکند. زاویه بین این دو خط، زاویه همگرایی مفصل را تشکیل میدهد که معیاری کمی برای ارزیابی همراستایی مفصل زانو در تصاویر رادیوگرافی است [12]. مقادیر غیرطبیعی این زاویه میتواند نشانگر وجود ناهنجاریهای مفصلی، از جمله تغییرات مرتبط با آرتروز باشد. تصویر شماره 5 نحوه ترسیم خطوط مرجع و روش اندازهگیری زاویه همگرایی مفصل را بهصورت شماتیک نمایش میدهد.
روش تحلیل آماری
بهمنظور ارزیابی میزان وابستگی بین «پیشرفت آرتروز زانو و مجموعهای از پارامترهای بالینی و بیومکانیکی مرتبط با مفصل زانو» و شدت بیماری، از تحلیلهای آماری کلاسیک شامل رگرسیون آماری و ضریب همبستگی پیرسون با استفاده از نرمافزار SPSS نسخه 27 محاسبه گردید. این تحلیلها امکان شناسایی روابط خطی و معنادار میان متغیرهای کلیدی را فراهم میکنند و مبنایی برای انتخاب ورودیهای مؤثر در مدلسازی پیشبینانه فراهم میسازند. افزون بر روشهای آماری سنتی، برای مدلسازی و پیشبینی شدت آرتروز از رویکردهای مبتنی بر یادگیری ماشین نیز استفاده شد. در این راستا، چند الگوریتم قدرتمند مورد استفاده با کدنویسی در نرمافزار پایتون شامل «الگوریتم نزدیکترین همسایه»، «شبکه عصبی مصنوعی» و «مدل کتبوست در دو ساختار باینری (برای تفکیک افراد سالم از مبتلا) و چندمتغیره (برای پیشبینی شدت آرتروز در پنج سطح کلگرن–لارنس)» انجام شده است.
برای انجام فرآیند طبقهبندی بیماران براساس درجات مختلف شدت آرتروز نیز از مدل جنگل تصادفی استفاده شد. ترکیب این روشها امکان تحلیل چندجانبه دادهها را فراهم کرده و بستر مناسبی برای شناسایی پارامترهای تأثیرگذار و توسعه مدلهای پیشبینیکننده فراهم میآورد، در ذیل روش توزیع دادهها در هر بخش ارائه شده است.
ضریب همبستگی پیرسون
ضریب همبستگی پیرسون معیاری آماری برای سنجش میزان و نوع رابطه خطی بین دو متغیر کمی است (فرمول شماره 1). این ضریب با نماد R نمایش داده میشود و مقدار آن در بازهای بین 1- تا 1+ قرار دارد. مقدار R=0 بیانگر عدم وجود همبستگی خطی بین دو متغیر است، درحالیکه R=+1 به معنای وجود همبستگی کامل مثبت (رابطه مستقیم کامل) و R=−1 نشاندهنده همبستگی کامل منفی (رابطه معکوس کامل) بین آنهاست [23].
روش نزدیکترین همسایه
در این مطالعه، از الگوریتم نزدیکترین همسایه (KNN) بهعنوان یک روش یادگیری نظارتشده برای بررسی ارتباط میان پیشرفت آرتروز و ترکیب پارامترهای بیومکانیکی و بالینی استفاده شده است. این الگوریتم فاصله میان نمونهها را محاسبه کرده و براساس K نمونه نزدیکتر، مقدار یا کلاس جدید را پیشبینی میکند. [24]. برای ارزیابی مدل، دادهها به دو مجموعه آموزش و آزمون تقسیم شده و پس از یادگیری از مجموعه آموزشی، عملکرد مدل به نسبت80 درصد از دادههای آموزش و 20 درصد از آزمون، برای پیشبینی شدت آرتروز در دادههای جدید مراحل سرچ الگوریتم بررسی گردید.
شبکه عصبی مصنوعی
شبکه عصبی مصنوعی بهعنوان یکی از روشهای پیشرفته یادگیری ماشین جهت تحلیل ارتباط میان شدت آرتروز زانو و متغیرهای بیومکانیکی و بالینی استفاده شد. این مدل بر پایه ساختاری متشکل از چندین لایه پردازشی متوالی بنا شده است که در آن هر لایه شامل تعدادی نورون (واحد پردازشی) است. دادههای ورودی با عبور از این نورونها و اعمال وزنهای اختصاصی، به لایههای بعدی منتقل شده و در نهایت، خروجی تولید میشود. فرآیند آموزش مدل شبکه عصبی مصنوعی شامل سه مرحله اصلی است:
۱. انتشار رو به جلو
در این مرحله، دادههای ورودی بهصورت متوالی از لایههای شبکه عبور میکنند و خروجی موقت محاسبه میشود.
۲. محاسبه خطا
اختلاف بین خروجی واقعی و خروجی موردانتظار (برچسب داده) اندازهگیری میشود.
۳. انتشار به عقب
با استفاده از الگوریتم گرادیان نزولی، وزنهای شبکه بهگونهای بهروزرسانی میشوند که خطای مدل در تکرارهای بعدی کاهش یابد [25].
در این تحقیق، برای آموزش و ارزیابی مدل، مجموعه دادهها به دو بخش تقسیم شدند: 80 درصد از دادهها برای آموزش و 20 درصد برای آزمون مدل اختصاص یافت (جدول شماره 1).
تابع فعالسازی مورداستفاده در نورونها، تابع سیگموید بود که امکان مدلسازی روابط غیرخطی بین متغیرها را فراهم میسازد. فرآیند آموزش تا زمان همگرایی مدل و رسیدن به دقت بهینه ادامه یافت. پس از اتمام آموزش، عملکرد مدل با استفاده از دادههای آزمون مورد ارزیابی قرار گرفت.
روش کتبوست
الگوریتم کتبوست یکی از پیشرفتهترین روشهای یادگیری ماشین مبتنی بر بوستینگ است که شرکت یاندیکس آن را توسعه داده است. این الگوریتم بهطور خاص برای کار با دادههای طبقهبندیشده طراحی شده و از مزایایی همچون عدم نیاز به پیشپردازش پیچیده دادهها و مدیریت خودکار ویژگیهای غیرعددی برخوردار است. کتبوست با بهرهگیری از تکنیکهای گرادیان بوستینگ، مجموعهای از مدلهای ضعیف (مانند درختهای تصمیم ساده) را بهصورت تکراری ترکیب میکند تا مدلی قوی و با دقت بالا ایجاد نماید. در این مطالعه، الگوریتم کتبوست در دو ساختار اصلی اجرا و مورد تحلیل قرار گرفته است:
-کتبوست باینری
این ساختار برای طبقهبندی دودویی بهکار گرفته میشود، بهگونهای که نمونهها براساس ویژگیهای داده به یکی از دو دسته مشخص (مثلاً «سالم» یا «مبتلا») تقسیم میشوند. در این حالت، مدل تلاش میکند با دقت بالا بین دو برچسب (0) و (1) تمایز قائل شود.
- کتبوست چندمتغیره
در این ساختار، مدل قادر است دادهها را به بیش از دو کلاس متمایز طبقهبندی کند. در این پژوهش، پیشبینی شدت آرتروز براساس مقیاس درجهبندی کلگرن – لارنس از جمله کاربردهای این ساختار محسوب میشود.
در این پژوهش، دادهها به دو بخش مجموعه آموزش و مجموعه آزمون تقسیم شده و مدلها بر روی دادههای آموزش، آموزش دیدند. سپس عملکرد آنها با استفاده از دادههای آزمون مورد ارزیابی قرار گرفت. برای سنجش عملکرد مدلهای کتبوست، از مجموعهای از شاخصهای آماری استاندارد استفاده شد که شامل این موارد هستند [25] :
برای ارزیابی عملکرد مدلها، از این معیارها استفاده میشود:
معیارهای دقت، حساسیت، دقت پیشبینی مثبت، دقت پیشبینی منفی (NPV) و افزایش مثبت (PPV) محاسبه و تحلیل شدند. در کنار این معیارها، برای تحلیل خطاهای طبقهبندی نیز از شاخصهای تشخیص صحیح و نادرست استفاده شد:
- مشخصههای TP: تعداد مواردی که مدل بهدرستی آنها را در کلاس 1 (مبتلا) شناسایی کرده است.
- مشخصههای TN: تعداد نمونههایی که مدل بهدرستی آنها را در کلاس 0 (سالم) طبقهبندی کرده است.
- مشخصههای FP: تعداد نمونههایی که مدل بهاشتباه آنها را بهعنوان مبتلا طبقهبندی کرده است، در حالیکه واقعاً سالم بودهاند.
- مشخصههای FN: تعداد نمونههایی که مدل به اشتباه آنها را بهعنوان سالم تشخیص داده، درحالیکه در واقع مبتلا بودهاند.
مقادیر دقیق این شاخصها و فرمولهای محاسبه آنها ارائه شدهاند (فرمولهای شماره 2، 3، 4، 5، 6، 7) [13]:
معیار Score -F1 یک معیار جامع است که هم دقت پیشبینی مثبت و هم حساسیت را مورد ارزیابی قرار میدهد. این معیار بهطور همزمان توازن بین دقت و حداقل اشتباهات کاذب را نیز بررسی میکند.
یافتهها
در این پژوهش، تحلیل آماری و مدلسازی یادگیری ماشین برای بررسی ارتباط پارامترهای بیومکانیکی و بالینی با شدت آرتروز زانو انجام شد. روشهای مورداستفاده شامل ضریب همبستگی پیرسون، نزدیکترین همسایه، شبکه عصبی مصنوعی، مدل کتبوست باینری و مدل کتبوست چندمتغیره بود.
تحلیل همبستگی پیرسون
برای ارزیابی ارتباط بین شدت آرتروز با 17 متغیر بیومکانیکی (جدول شماره 2) و عوامل بالینی (جنس، سن، قد، وزن و شاخص توده بدن)، از ضریب همبستگی پیرسون استفاده شد. نتایج نشان داد:
وزن با شدت آرتروز همبستگی مثبت و معنادار داشت (0/036= P و 0/122=r)، درحالیکه شاخص توده بدن همبستگی غیرمعنادار و ضعیف نشان داد (0/079=P و 0/103=r).
- زاویه راستای مفصل در پای چپ همبستگی منفی و معنادار با شدت آرتروز داشت (0/001=P و 0/220=r)، اما همین پارامتر در پای راست ارتباط معناداری نداشت.
- زاویه همگرایی مفصل زانوی چپ همبستگی مثبت و معنادار نشان داد (0/006=P و 0/185=r) که بیانگر افزایش زاویه با تشدید بیماری بود.
- حداقل ضخامت فضای مفصل همبستگی معکوس و معناداری با شدت آرتروز داشت (0/036=P و 0/122=r) که نشاندهنده کاهش ضخامت مفصل با پیشرفت بیماری بود.
- در مجموع، متغیرهای بیومکانیکی نظیر زاویه همگرایی و ضخامت فضای مفصل بیشترین ارتباط را با شدت آرتروز داشتند، در حالیکه متغیرهای عمومیتر نظیر سن و جنسیت فاقد ارتباط معنادار بودند.
پیشبینی میزان شدت آرتروز با روش کتبوست- باینری
در این تحلیل، نمونهها براساس مقیاس کلگرن-لارنس به دو کلاس تقسیم شدند (جدول شماره 3): کلاس 0 (درجات 0 و 1) و کلاس 1 (درجات 2 تا 4).
هدف، ارزیابی عملکرد مدل در تفکیک این دو گروه بود. نتایج حاصل از مدلهای مختلف در طبقهبندی دادههای بالینی به شرح زیر است (جدول شماره 4):
- مدل جنگل تصادفی در چارچوب کتبوست، با دقت 54 درصد بهترین عملکرد را داشت.
- مدل کتبوست باینری عملکردی مشابه با جنگل تصادفی داشت.
- شبکه عصبی مصنوعی و نزدیکترین همسایه بهترتیب با دقت 44/07 درصد و 47 درصد، عملکرد ضعیفتری نشان دادند.
یافتهها نشان دادند مدلهای مبتنی بر درخت تصمیم، بهویژه کتبوست، بهدلیل مدیریت مؤثر عدم توازن دادهها و استخراج ویژگیهای مهم، در پیشبینی آرتروز عملکرد بهتری دارند. در مقابل، مدلهای KNN و ANN بهدلیل نیاز به دادههای بیشتر و محدودیت در شناسایی الگوهای پیچیده، نتایج ضعیفتری داشتند.
بر اساس (جدول شماره 5)، عملکرد مدل کتبوست در مقایسه با جنگل تصادفی در تحلیل دادههای بالینی مورد ارزیابی قرار گرفت.
نتایج نشان داد مدل کتبوست با دقت کلی 54 درصد عملکردی همسطح با جنگل تصادفی داشت. حساسیت مدل برای تشخیص کلاس سالم (0) برابر با 47 درصد و برای کلاس آرتروزدار (1) معادل 61 درصد بود که نشاندهنده توان بالاتر مدل در شناسایی بیماران مبتلا به آرتروز است.
مقادیر F1-score برای کلاسهای 0 و 1 بهترتیب 51 درصد و 57 درصد درصد گزارش شد که بیانگر عملکرد متوازن مدل در تفکیک این دو گروه میباشد. همچنین، میانگینهای ماکرو و وزنی معیارهای ارزیابی هر دو برابر با 54 درصد بودند که همترازی عملکرد مدل با جنگل تصادفی را تأیید میکنند.
بهطورکلی، مدل کتبوست در تشخیص موارد سالم دقت کمتری نسبت به موارد آرتروزدار داشت که این موضوع بر لزوم بهینهسازی بیشتر مدل برای بهبود عملکرد در تشخیص نمونههای غیربیمار دلالت دارد.
جدول شماره 6 عملکرد مدل کتبوست-باینری را در طبقهبندی آرتروز بر پایه پارامترهای بیومکانیکی ارائه میدهد.
دقت کلی مدل 79 درصد بوده که بیانگر توان بالای آن در شناسایی صحیح نمونههاست. در کلاس سالم (کلاس 0)، دقت، حساسیت و F1-score بهترتیب 82 درصد، 85 درصد و 84 درصد گزارش شده که نشاندهنده عملکرد مطلوب مدل در تفکیک نمونههای غیربیمار است. درمقابل، مدل در تشخیص کلاس آرتروزدار (کلاس 1) عملکرد ضعیفتری داشته است؛ بهطوریکه دقت 74 درصد، حساسیت 69 درصد و F1-score برابر با 71 درصد بهدست آمده است. این نتایج بیانگر چالش مدل در شناسایی دقیق افراد مبتلا به آرتروز میباشند.
میانگین ماکرو برای معیارهای دقت، حساسیت و F1-score بهترتیب برابر با 78 درصد، 77 درصد و 78 درصد و میانگین وزنی آنها نیز معادل 79 درصد بوده است؛ نتایجی که نشاندهنده تعادل نسبی مدل در طبقهبندی کلاسها و اثربخشی مراحل بهینهسازی جهت کاهش اثرات عدم توازن دادهها هستند.
بهطورکلی، اگرچه مدل کتبوست-باینری در شناسایی نمونههای سالم موفق عمل کرده، اما بهبود عملکرد در تشخیص بیماران آرتروزدار میتواند به افزایش دقت کلی و بهینهسازی بیشتر سیستمهای تشخیص خودکار منجر شود.
تصویر شماره 6 ماتریس آشفتگی عملکرد مدل کتبوست-باینری را براساس پارامترهای بیومکانیکی نمایش میدهد.
این ماتریس نشاندهنده دقت مطلوب مدل در شناسایی نمونههای سالم (کلاس 0) است، اما ضعف نسبی آن در تشخیص دقیق نمونههای آرتروزدار (کلاس 1) نیز مشهود است و به بهبود نیاز دارد.
مطابق جدول شماره 7، عملکرد مدلهای مختلف یادگیری ماشین در طبقهبندی کلاسهای سالم و آرتروزدار مورد ارزیابی قرار گرفته است.
مدل کتبوست-باینری با دقت مثبت 79 درصد و دقت کلی 74 درصد در تشخیص کلاس آرتروزدار، عملکرد بهتری نسبت به مدل جنگل تصادفی با دقتهای 77 درصد و 73 درصد نشان داده است. این نتایج بیانگر کارایی بالاتر کتبوست-باینری در شناسایی موارد مثبت بیماری است.
در ارزیابی سایر مدلها، دقت مدل نزدیکترین همسایه 74/43 درصد و مدل شبکه عصبی مصنوعی 73/31 درصد گزارش شده است. مقایسه دقت پیشبینی کلاس سالم (کلاس 0) در بین مدلها بهترتیب زیر است:
مدل کتبوست باینری: 82 درصد،
مدل کتبوست با کلاسبندی جنگل تصادفی: 79 درصد،
نزدیکترین همسایه: 84/20 درصد،
شبکه عصبی مصنوعی: 89/60 درصد.
با وجود دقت بالای برخی مدلها در پیشبینی کلاس سالم، مدل کتبوست-باینری بهدلیل تعادل مناسب میان دقت در هر دو کلاس و قابلیت استخراج ویژگیهای مؤثر، عملکرد کلی بهتری دارد. این ویژگی، آن را به گزینهای مناسب برای تحلیل دادههای بیومکانیکی و طبقهبندی بیماران مبتلا به آرتروز زانو تبدیل میکند.
نتایج جدول شماره 8 نشان میدهد مدل کتبوست-باینری در تحلیل دادههای بیومکانیکی با دقت 79 درصد عملکرد بسیار بهتری نسبت به زمانی دارد که از دادههای بالینی (با دقت 54 درصد) استفاده میشود.
این تفاوت قابلتوجه در دقت مدل، تأکیدی بر اهمیت بالاتر پارامترهای بیومکانیکی در پیشبینی شدت آرتروز زانو نسبت به متغیرهای عمومی بالینی است و نقش تعیینکننده این متغیرها را در بهبود کیفیت پیشبینی مدلهای یادگیری ماشین برجسته میسازد.
پیشبینی میزان شدت آرتروز با روش کتبوست - چند متغیره
فرآیند آمادهسازی دادهها برای آموزش و آزمون در این بخش مشابه روشهای مورد استفاده در مدلسازیهای پیشین انجام شده است. جدول شماره 9 توزیع تعداد نمونهها را در هر کلاس شدت آرتروز بر اساس مقیاس کلگرن-لارنس برای مدل کتبوست چندمتغیره نشان میدهد.
ارزیابی عملکرد مدل براساس دادههای بالینی در جدول شماره 10 ارائه شده است.
نتایج بیانگر آن است که مدل در طبقهبندی کلاسهای 0 و 1 (سالم و آرتروز خفیف) عملکرد نسبتاً بهتری داشته، درحالیکه در طبقهبندی کلاسهای با شدت بالاتر (کلاسهای 3 و 4)، بهدلیل حجم محدود نمونهها، دقت و حساسیت کاهش یافته است. دقت کلی مدل 0/33 و میانگین وزنی F1-score برابر با 0/35 گزارش شده که نشاندهنده عملکرد متوسط مدل در تفکیک بین کلاسها است.
ماتریس آشفتگی (تصویر شماره 7) نیز بیانگر آن است که بیشترین دقت مدل در شناسایی کلاس 1 (آرتروز خفیف) بوده و در سایر درجات، بهویژه کلاسهای بالاتر، افت محسوسی در عملکرد مشاهده شده است.
این وضعیت میتواند بهدلیل توزیع نامتوازن دادهها، همپوشانی ویژگیها بین کلاسها و نیز ماهیت تدریجی پیشرفت آرتروز باشد که مرز مشخصی بین درجات مختلف آن ایجاد نمیکند.
برای بهبود عملکرد مدل پیشنهاد میشود: افزایش حجم دادههای آموزشی، استفاده از روشهای مدیریت عدمتوازن داده (مانند oversampling یا SMOTE) و بهینهسازی هایپرپارامترهای مدل بهصورت نظاممند صورت گیرد.
در مدل کتبوست– چندمتغیره با استفاده از پارامترهای بیومکانیکی، توزیع نمونهها در هر کلاس (جدول شماره 11) بسیار گستردهتر از دادههای بالینی بوده و بهویژه کلاس 1 (آرتروز خفیف) با 482 نمونه، بیشترین تعداد را به خود اختصاص داده است.
کلاس 4 (آرتروز شدید) نیز همچنان با 21 نمونه کمترین سهم را دارد.
عملکرد مدل در این حالت (جدول شماره 12) نشاندهنده بهبود قابلملاحظه در توانایی پیشبینی شدت آرتروز است.
دقت کلی مدل به 0/60 افزایش یافت و معیارهای حساسیت و F1-score نیز نتایج مناسبی ارائه دادند:
- حساسیت برای کلاس 0: 54 درصد
- حساسیت برای کلاس 1: 73 درصد
- میانگین ماکرو برای دقت، حساسیت و F1-score بهترتیب برابر با 0/50، 0/48 و 0/58
- میانگین وزنی این معیارها نیز در حدود 60 درصد گزارش شد- حساسیت برای کلاس 0: 54 درصد
- حساسیت برای کلاس 1: 73 درصد
- میانگین ماکرو برای دقت، حساسیت و F1-score بهترتیب برابر با 0/50، 0/48 و 0/58
- میانگین وزنی این معیارها نیز در حدود 60 درصد گزارش شد.
مطابق ماتریس آشفتگی (تصویر شماره 8)، مدل بیشترین دقت را در شناسایی کلاس 1 (آرتروز خفیف) داشته و عملکرد آن در کلاسهای 0، 2 و 3 نسبتاً پایینتر بوده است.
در مورد کلاس 4، بهدلیل حجم بسیار پایین داده، مدل توانایی کافی در شناسایی صحیح نمونهها از خود نشان نداد.
این یافتهها نشان میدهد مدل در پیشبینی مراحل اولیه آرتروز بهویژه در کلاس 1 عملکرد مطلوبی دارد، اما در تمایز بین کلاسهای با شدت بالاتر یا کلاسهایی با دادههای نامتوازن، با کاهش دقت مواجه است. این مسئله ضرورت بهکارگیری روشهای تقویت داده، بالانسسازی کلاسها و بهینهسازی بیشتر مدل را برجسته میسازد.
بحث
مطالعات پیشین در زمینه تحلیل آماری، ارتباط میان شدت آرتروز زانو و پارامترهای بیومکانیکی (نظیر ضخامت فضای مفصل و زاویه راستای مفصل) و همچنین عوامل بالینی (از جمله جنس، سن و شاخص توده بدنی) عمدتاً بهصورت موردی با جامعه آماری محدود و بدون بهرهگیری از رویکردهای یادگیری ماشین انجام شدهاند. همچنین، یافتههای گذشته نشان دادهاند که پارامترهای بالینی مانند سن، جنسیت و شاخص تودهبدنی بهتنهایی توان پیشبینی بالایی درخصوص شدت آرتروز ندارند و دقت کافی را فراهم نمیکنند. ازسویدیگر، رویکردهایی نظیر رگرسیون لجستیک و تحلیلهای مبتنی بر یادگیری عمیق بر روی تصاویر رادیوگرافی، بهدلیل محدودیت در شفافسازی روابط میان ویژگیها، نتوانستهاند عملکرد قابلقبولی در تفسیر بیومکانیکی مفصل زانو ارائه دهند. در آنها نیز بهطور جامع از ترکیب دادههای حاصل از نرمافزارهای تحلیلی تخصصی مانند اودیا و الگوریتمهای یادگیری ماشین برای پیشبینی شدت آرتروز استفاده نشده است.
برخی از پژوهشها بهکارگیری روشهای طبقهبندی ترتیبی و تحلیل تصاویر رادیوگرافی دوبعدی را پیشنهاد دادند [13، 14، 19]. در تحلیل دادههای بیومکانیکی، رابطه میان شدت آرتروز و عوامل بالینی شامل سن، جنسیت، وزن، قد و شاخص توده بدنی نیز با استفاده از رگرسیون آماری و ضریب همبستگی پیرسون ارزیابی شد. از میان پارامترهای بررسیشده، حداقل ضخامت فضای مفصل، زاویه راستای مفصل و زاویه همگرایی بیشترین همبستگی آماری را با شدت آرتروز داشتند که با نتایج گزارششده در پژوهشهای [13، 19] همخوانی دارد. وزن نیز بهعنوان یک عامل بالینی مؤثر، رابطه معناداری با پیشرفت آرتروز نشان داد، درحالیکه شاخص توده بدنی به تنهایی شاخص پیشبینیکننده قابلاعتمادی نبود. این یافته با مطالعاتی مانند طارق و یوسف [14، 19] نیز تأیید میشود که اهمیت دادههای ساختاری دقیقتر را نسبت به متغیرهای عمومیتر نشان دادهاند.
در مطالعه حاضر، برای نخستینبار اندازهگیری دقیق پارامترهای بیومکانیکی مفصل زانو شامل ضخامت فضای مفصل، زاویه راستای مفصل و زاویه همگرایی مفصل با استفاده از نرمافزار اودیا و بر روی مجموعهای گسترده از دادهها و جامعه آماری بزرگتر انجام شد. سپس، با استفاده از الگوریتمهای مختلف یادگیری ماشین شامل نزدیکترین همسایه، شبکه عصبی مصنوعی و مدلهای کتبوست (در دو حالت باینری و چندمتغیره)، به بررسی رابطه میان این پارامترها و شدت آرتروز پرداخته شد. مدل جنگل تصادفی نیز بهعنوان روش مقایسهای برای طبقهبندی دادهها بهکار گرفته شد. تحلیل مدلهای یادگیری ماشین نیز نشان داد که در ارزیابی متغیرهای بالینی، مدل جنگل تصادفی عملکرد نسبتاً بهتری در شناسایی موارد آرتروز خفیف ارائه میدهد. بااینحال، بهترین نتایج در طبقهبندی مبتنی بر پارامترهای بیومکانیکی حاصل شد.
بهطور خاص، مدل کتبوست–باینری در تحلیل پارامترهای بیومکانیکی با دقت 82 درصد و مدل کتبوست–چندمتغیره با دقت 60 درصد و حساسیت 73 درصد، عملکرد بهینهای در پیشبینی شدت آرتروز (بهویژه در درجات پایینتر کلگرن– لارنس) ارائه دادند. در تحلیل چندمتغیره، مدل کتبوست توانایی مناسبی در تشخیص آرتروز خفیف (درجات 0 و 1) داشت، اما در شناسایی موارد شدید (درجه 4)، دقت مدل بهطور قابلتوجهی کاهش یافت. این موضوع میتواند ناشی از توزیع نامتوازن دادهها، تعداد محدود نمونه در درجات بالای بیماری و تداخل ویژگیهای ساختاری در سطوح پیشرفته آرتروز باشد. این موضوع میتواند بهدلیل عدم توازن نمونهها در این کلاسها و همچنین پیچیدگیهای ساختاری این سطوح باشد. مشابه این چالشها در مطالعات مانند طارق و یوسف [14، 19] نیز گزارش شده است.
همچنین، استفاده از مدلهای سادهتر مانند KNN و ANN، عملکرد ضعیفتری در کلاسهای نابرابر نشان دادند (دقت کمتر از 70 درصد)، که بر اهمیت انتخاب مدل مناسب متناسب با توزیع داده تأکید میکند.
مجموعه این نتایج نشان میدهد مدلهای یادگیری ماشین، بهویژه کتبوست، میتوانند ابزارهای قدرتمند و مؤثری برای تحلیل آماری و پیشبینی پیشرفت آرتروز زانو باشند. عملکرد بالای این مدلها در پردازش پارامترهای بیومکانیکی که با دقت بالایی اندازهگیری شدهاند میتواند کاربرد آنها را در طراحی سیستمهای تشخیص یاریرسان مبتنی بر تصویر و ارتقای ابزارهای تصمیمیار در کلینیکهای ارتوپدی توجیه میکند. در نهایت، این مطالعه نشان داد استفاده هدفمند از دادههای دقیق بیومکانیکی در کنار الگوریتمهای یادگیری ماشین میتواند چشماندازهای جدیدی را در زمینه ارزیابی، پایش و درمان بیماران مبتلا به آرتروز زانو فراهم سازد. بهبود فرایندهای آموزش مدل، گسترش مجموعه دادههای آموزشی و بهکارگیری تکنیکهای بهینهسازی میتواند به افزایش دقت و کارایی این سیستمها در کاربردهای بالینی آینده منجر شود.
نتیجهگیری
این مطالعه بهطور جامع ارتباط بین متغیرهای بیومکانیکی و بالینی مفصل زانو با شدت آرتروز را تحلیل کرده و کارایی مدلهای یادگیری ماشین را در پیشبینی این بیماری ارزیابی نموده است. نتایج نشان داد متغیرهایی مانند حداقل ضخامت فضای مفصل، زاویه راستای مفصل، زاویه همگرایی و وزن، با شدت آرتروز رابطه معناداری دارند، درحالیکه سن، جنسیت و شاخص تودهبدنی چنین ارتباطی نداشتند. این یافتهها بر اهمیت عوامل بیومکانیکی در مدیریت آرتروز و لزوم کنترل وزن تأکید دارند. همچنین ارتباط پارامترهای بیومکانیکی اندازهگیری شده، که برای اولین بار با دقت بالایی با نرمافزار اودیا انجام شده است، مورد ارزیابی قرار گرفت.
مدل کتبوست – باینری در تحلیل پارامترهای بیومکانیکی با دقت 82 درصد و مدل کتبوست–چندمتغیره با دقت 60 درصد و حساسیت 73 درصد، عملکرد بهینهای در پیشبینی شدت آرتروز (بهویژه در درجات پایینتر کلگرن – لارنس) ارائه دادند. شایان ذکر است که در تحلیل چندمتغیره، مدل کتبوست توانایی مناسبی در تشخیص آرتروز خفیف (درجات 0 و 1) داشت، اما در شناسایی موارد شدید (درجه 4)، دقت مدل بهطور قابلتوجهی کاهش یافت. یافتهها نشان میدهند ترکیب دادههای ساختاری مفصل با الگوریتمهای پیشرفته یادگیری ماشین میتواند در ارتقاء تشخیص زودهنگام، پایش پیشرفت بیماری و بهینهسازی تصمیمات درمانی نقش مؤثری ایفا کند.
بهطورکلی، نتایج این تحقیق نشان میدهد مدلهای یادگیری ماشین، بهویژه کتبوست، میتوانند بهعنوان ابزارهای مؤثر در تحلیل آماری دادههای بیومکانیکی و پیشبینی شدت آرتروز زانو مورد استفاده قرار گیرند. ترکیب دادههای ساختاری مفصل با الگوریتمهای پیشرفته یادگیری ماشین امکان ارتقای فرایندهای تشخیص زودهنگام، پایش پیشرفت بیماری و بهینهسازی تصمیمات درمانی را فراهم میسازد.
یافتههای این مطالعه میتوانند گامی مؤثر در جهت توسعه سیستمهای پشتیبان تصمیمگیری بالینی، طراحی ابزارهای غربالگری هوشمند و نیز بهبود راهکارهای درمانی برای بیماران مبتلا به آرتروز زانو فراهم آورند.
ملاحظات اخلاقی
پیروی از اصول اخلاق پژوهش
این مطالعه در دانشگاه بیرجند و با استفاده از دادههای مطابق با پروتکل، اصول عملکرد بالینی (GCP)، اعلامیه هلسینکی و الزامات نظارتی اخلاقی و قانونی قابلاجرا (برای همه کشورهای درگیر) انجام میشود و با شماره (clinicaltrials.gov: NCT03883568) ثبت شده است. همه شرکتکنندگان اطلاعات شفاهی و کتبی دریافت کرده و رضایتنامه کتبی آگاهانه ارائه دادهاند.
حامی مالی
این مقاله برگرفته از پایاننامه آقای علی بهرامیان گروه پژوهشی ارتوپدی-بیومکانیک، گروه مهندسی مکانیک، دانشگاه بیرجند میباشد.
مشارکت نویسندگان
تحلیلهای آماری: علی بهرامیان؛ روشهای یادگیری ماشین و پیشنویس مقاله: وحید اربابی؛ نظارت و بازبینیهای علمی و اساسی: مهدی راغبی.
تعارض منافع
بنابر اظهار نویسندگان، این مقاله تعارض منافع ندارد.
تشکر و قدردانی
از تمامی شرکتکنندگانی که در این مطالعه حضور داشتند، تشکر و قدردانی میشود.
References
References