انتقاء الجينات لتصنيف سرطان الثدي باستخدام الترشيح باختبار "ت" والتحسين القائم على التغليف
DOI:
https://doi.org/10.5281/zenodo.18112300%20الكلمات المفتاحية:
تصنيف سرطان الثدي، التعبير الجيني، اختيار الخصائص، التصفية باختبار تي، اساليب التغليف، الاختيار الأمامي التسلسلي، الخوارزميات الجينية، تسلق التل، بيانات المصفوفات الدقيقة، المعلوماتية الحيويةالملخص
يواجه التصنيف الدقيق لسرطان الثدي باستخدام بيانات التعبير الجيني تحديات ناجمة عن الأبعاد العالية والتشويش في مجموعات بيانات المصفوفات الدقيقة. تقترح هذه الدراسة وتقيّم مساراً هجيناً لاختيار الميزات يدمج أسلوب الترشيح باستخدام "اختبار تي" T-Test مع أربع طرق تحسين قائمة على التغليف، وهي: الاختيار الأمامي المتسلسل، والاختيار الخلفي المتسلسل، والخوارزميات الجينية، وخوارزمية تسلق التل.
استُخدم "اختبار تي" أولاً لتقليل فضاء الميزات الأولي، وبعد ذلك تم استخدام كل طريقة من طرق التغليف لتحديد مجموعة فرعية جينية مثالية بناءً على أداء المصنف. أظهرت النتائج التجريبية أن طريقة حققت أعلى دقة تصنيف (98%) وأعلى مساحة تحت المنحنى بلغت 0.99، بينما وفرت خوارزمية تسلق التل أسرع وقت للتنفيذ (1.68 ثانية) ولكن بمقايضة في مستوى النوعية .
ومن الملاحظ أنه تم اختيار الجينين SFRP1 و CNTNAP3 بشكل متكرر بواسطة طرق مختلفة، مما يشير إلى إمكانية اعتبارهما مؤشرات حيوية رئيسية. ولمزيد من توضيح هذه النتائج، أجرينا تحليلاً معمقاً للتداخلات الجينية باستخدام مؤشرات جاكارد واستكشفنا الأدوار البيولوجية للجينات المختارة، مما كشف عن وظيفة جين SFRP1 الكابتة للأورام عبر تثبيط مسار Wnt، والقيمة الإنذارية الناشئة لجين CNTNAP3 في أنواع مختلفة من السرطان.
تؤكد هذه النتائج فعالية استراتيجيات الاختيار الهجينة وتوفر رؤى حاسمة حول المفاضلة بين أداء المصنف، والتكلفة الحسابية، واستقرار الجينات في تصنيف سرطان الثدي. يتضمن هذا التحليل الموسع تصورات مرئية إضافية للأداء ومقاييس تداخل مفصلة لتقديم رؤية شاملة لمدى قابلية تطبيق اختيار الميزات الهجين في مجال المعلوماتية الحيوية.

