على سبيل المثال، مقطعي الدنا من شخصين مختلفين، AAGCCTA و AAGCTTA تحتوي على اختلاف في نوكليوتيد واحد. في هذه الحالة نقول أنه هناك أليلان. تقريبًا جميع تعدد أشكال النوكليوتيد المفرد لديها أليلين فقط. توزيع تعدد أشكال النوكليوتيد المفرد في المجين ليس متجانس; يحدث تعدد أشكال النوكليوتيد المفرد في مناطق غير الترميز أكثر من مناطق الترميز؛ أو بشكل عام، حيث يتصرف الانتقاء الطبيعي و«تصلح» أليل (مزيلة أشكال أخرى) تعدد أشكال النوكليوتيد المفرد الذي يشكّل التكيّف الوراثي الأكثر ملائمة.[1] تلعب كذلك عوامل أخرى مثل التأشيب الجيني ووتيرة الطفرات دورًا في تحديد كثافة تعدد أشكال النوكليوتيدت المفردة.[2]
في علم الوراثة، تعدد الأشكال أحادي النوكليوتيدات هو استبدال لنيوكليوتيد واحد في موضع معين في الجينوم، وهو موجود في جزء كبير بما فيه الكفاية من عدد السكان (على سبيل المثال 1٪ أو أكثر).[3]
على سبيل المثال، في موضع أساسي معين في الجينوم البشري، قد يظهر النوكليوتيد C في معظم الأفراد، ولكن في أقلية من الأفراد، يشغل هذا المنصب A. هذا يعني أن هناك SNP في هذا الموضع المحدد، ويقال أن التنوعين المحتملين للنيوكليوتيدات - C أو A - هما الأليلات لهذا الموضع المحدد.
المتغير أحادي النوكليوتيدات (SNV) هو تباين في نيوكليوتيد واحد دون أي قيود على التردد. يختلف SNV عن SNP لأنه عندما يتم اكتشاف SNV في عينة من كائن حي من نوع ما، فمن المحتمل أن يكون SNV SNP ولكن لا يمكن تحديد ذلك من كائن حي واحد فقط.[8][9] ومع ذلك، فإن SNP يعني أن النيوكليوتيدات تختلف في مجموعة الكائنات الحية. قد تنشأ SNVs في الخلايا الجسدية. يمكن أيضًا تسمية الاختلاف الجسدي أحادي النوكليوتيدات (على سبيل المثال، الناجم عن السرطان) باسم تغيير النوكليوتيدات المفردة . تظهر SNVs بشكل شائع في التشخيص الجزيئي. على سبيل المثال، عند تصميم بادئات تفاعل البوليميراز المتسلسل للكشف عن الفيروسات، قد يحتوي الحمض النووي الريبي الفيروسي أو الحمض النووي في عينة مريض واحدة على SNVs.
أنواع
قد يقع تعدّد أشكال النوكليوتيد المفرد ضمن تسلسلات الترميز في الجينات، أو مناطق غير الترميز، أو في المناطق بين الجينات. تعدد ألأشكال داخل تسلسل الترميز لا يغيّر بالضرورة تسلسل الأحماض الأمينية في البروتين الناتج، وذلك بسبب صفة الانحلالية في الشفرة الوراثية.
تنقسم SNPs في منطقة الترميز إلى نوعين: SNPs مترادفة وغير مترادفة. لا تؤثر SNPs المترادفة على تسلسل البروتين، بينما تغير SNPs غير المترادفة تسلسل الأحماض الأمينية للبروتين. إن SNPs غير المترادفة من نوعين: خطأ طفرة هراء.
قد لا تزال النيوكلوتايد غير الموجودة في مناطق ترميز البروتين تؤثر على الربط الجيني أو ارتباط عامل النسخ أو تدهور الرنا المرسال أو تسلسل الحمض النووي الريبي غير المشفر. يشار إلى التعبير الجيني المتأثر بهذا النوع من SNP على أنه eSNP (تعبير SNP) وقد يكون في المنبع أو المصب من الجين.
التطبيقات
يمكن لدراسات الجمعية تحديد ما إذا كان المتغير الجيني مرتبطًا بمرض أو سمة.[10]
علامة SNP عبارة عن تعدد أشكال أحادي النوكليوتيدات تمثيلي في منطقة من الجينوم مع اختلال توازن عالي الارتباط (الارتباط غير العشوائي للأليلات في موقعين أو أكثر). تعد Tag SNPs مفيدة في دراسات ارتباط SNP للجينوم الكامل، حيث يتم التنميط الجيني لمئات الآلاف من SNPs عبر الجينوم بأكمله.
رسم خرائط النمط الفردي: يمكن تجميع مجموعات من الأليلات أو تسلسلات الحمض النووي بحيث يتمكن SNP الفردي من تحديد العديد من تعدد الأشكال المرتبطة.
يشير اختلال التوازن (LD)، وهو مصطلح يستخدم في علم الوراثة السكانية، إلى ارتباط غير عشوائي للأليلات في موقعين أو أكثر، وليس بالضرورة على نفس الكروموسوم. يشير إلى ظاهرة تميل أن يتم توريث أليل SNP أو تسلسل الحمض النووي المتقاربين في الجينوم معًا. يمكن أن تتأثر صعوبة التعلم بمعلمين (من بين عوامل أخرى، مثل التقسيم الطبقي للسكان): 1) المسافة بين الأشكال المتعددة الأشكال [كلما كانت المسافة أكبر، كلما انخفض LD]. 2) معدل إعادة التركيب [كلما انخفض معدل إعادة التركيب، زاد LD].[11]
تكرار
تم العثور على أكثر من 335 مليون SNPs عبر البشر من مجموعات سكانية متعددة. يختلف الجينوم النموذجي عن الجينوم البشري المرجعي في 4 إلى 5 ملايين موقع، معظمها (أكثر من 99.9٪) تتكون من تعدد الأشكال (SNPs) وindels القصيرة.[12]
داخل الجينوم
التوزيع الجيني للنيوكليوتيدات SNPs ليس متجانسًا؛ تحدث النيوكلوتايد في المناطق غير المشفرة بشكل متكرر أكثر من المناطق المشفرة أو، بشكل عام، حيث يعمل الانتقاء الطبيعي و «يثبت» الأليل (استبعاد المتغيرات الأخرى) من SNP الذي يشكل التكيف الجيني الأكثر ملاءمة.[13] يمكن لعوامل أخرى، مثل إعادة التركيب الجيني ومعدل الطفرات، أن تحدد كثافة SNP.[14]
يمكن التنبؤ بكثافة SNP من خلال وجود سواتل مكروية: السواتل الدقيقة AT على وجه الخصوص هي مؤشرات قوية لكثافة SNP، مع وجود مساحات تكرار طويلة (AT) (n) في مناطق ذات كثافة SNP منخفضة بشكل كبير ومحتوى GC منخفض.[15]
ضمن السكان
هناك اختلافات بين البشر، لذلك قد يكون أليل SNP الشائع في مجموعة جغرافية أو عرقية أكثر ندرة في مجموعة أخرى. ضمن مجموعة سكانية، يمكن تخصيص تواتر أليل ثانوي لـ SNPs - أدنى تردد أليل في موضع لوحظ في مجتمع معين.[16] هذا هو ببساطة أقل ترددين من الأليل لتعدد الأشكال أحادي النوكليوتيدات.
مع هذه المعرفة، طور العلماء طرقًا جديدة في تحليل الهياكل السكانية في الأنواع الأقل دراسة.[17][18][19] باستخدام تقنيات التجميع، يتم تخفيض تكلفة التحليل بشكل كبير.[بحاجة لمصدر] هذه التقنيات على تسلسل مجتمع ما في عينة مجمعة بدلاً من تسلسل كل فرد داخل المجتمع بنفسه. مع أدوات المعلوماتية الحيوية الجديدة، هناك إمكانية للتحقيق في بنية السكان وتدفق الجينات وهجرة الجينات من خلال مراقبة ترددات الأليل داخل السكان بالكامل. مع هذه البروتوكولات، هناك إمكانية للجمع بين مزايا SNPs وعلامات القمر الصناعي الصغيرة.[20][21] ومع ذلك، هناك معلومات مفقودة في العملية مثل عدم توازن الارتباط ومعلومات الزيجوزية.
أهمية
يمكن أن تؤثر الاختلافات في تسلسل الحمض النووي للبشر على كيفية تطور البشر للأمراض والاستجابة لمسببات الأمراضوالمواد الكيميائيةوالأدويةواللقاحات والعوامل الأخرى. تعد SNPs ضرورية أيضًا للطب الشخصي.[22] تشمل الأمثلة الأبحاث الطبية الحيوية، والطب الشرعي، وعلم الوراثة الدوائية، وسببية المرض، على النحو المبين أدناه.
الأبحاث السريرية
تكمن الأهمية الكبرى لـ SNPs في البحث السريري في مقارنة مناطق الجينوم بين المجموعات (مثل الأفواج المتطابقة مع وبدون مرض) في دراسات الارتباط على مستوى الجينوم. تم استخدام SNPs في دراسات الارتباط على مستوى الجينوم كعلامات عالية الدقة في رسم خرائط الجينات المتعلقة بالأمراض أو السمات الطبيعية.[23] لا تزال النيوكلوتايد التي ليس لها تأثير ملحوظ على النمط الظاهري (ما يسمى الطفرات الصامتة) مفيدة كواسمات جينية في دراسات الارتباط على مستوى الجينوم، بسبب كميتها واستقرار وراثتها عبر الأجيال.[24]
التحاليل الجنائية
تم استخدام النيوكلوتايد في البداية لمطابقة عينة من الحمض النووي الشرعي مع المشتبه به ولكن تم التخلص منها تدريجياً مع تطوير تقنيات بصمة الحمض النووي القائمة على STR.[25] قد تسمح تقنيات تسلسل الجيل التالي (NGS) الحالية باستخدام أفضل للتنميط الجيني SNP في تطبيق الطب الشرعي طالما يتم تجنب المواقع الإشكالية.[26] في المستقبل، يمكن استخدام تعدد الأشكال في الطب الشرعي لبعض القرائن النمطية مثل لون العين، ولون الشعر، والعرق، وما إلى ذلك. كيد وآخرون. أظهر أن مجموعة من 19 تعدد الأشكال يمكن أن تحدد المجموعة العرقية ذات الاحتمالية الجيدة للمطابقة (Pm = 10 −7) في 40 مجموعة سكانية تمت دراستها.[27] أحد الأمثلة على كيف يمكن أن يكون هذا مفيدًا في مجال إعادة البناء الفني لمظاهر محتملة قبل الوفاة لبقايا هيكل عظمي لأفراد مجهولين. على الرغم من أن إعادة بناء الوجه يمكن أن تكون دقيقة إلى حد ما بناءً على السمات الأنثروبولوجية، إلا أن البيانات الأخرى التي قد تسمح بتمثيل أكثر دقة تشمل لون العين ولون البشرة ولون الشعر وما إلى ذلك.
في حالة وجود كمية منخفضة من عينة الطب الشرعي أو عينة متدهورة، يمكن أن تكون طرق SNP بديلاً جيدًا لطرق المعاملات المشبوهة نظرًا لوفرة الواسمات المحتملة، وإمكانية التشغيل الآلي، واحتمال تقليل طول الجزء المطلوب إلى 60-80 نقطة أساس فقط.[28] في حالة عدم وجود تطابق STR في قاعدة بيانات ملفات تعريف الحمض النووي؛ يمكن استخدام أشكال تعدد الأشكال المختلفة للحصول على أدلة بخصوص العرق والنمط الظاهري والنسب وحتى الهوية.
علم الوراثة الدوائية
ترتبط بعض أشكال النيوكلوتايد مع استقلاب الأدوية المختلفة.[29][30][31] يمكن أن تكون SNP طفرات، مثل الحذف، والتي يمكن أن تثبط أو تعزز النشاط الأنزيمي؛ يمكن أن يؤدي مثل هذا التغيير في النشاط الأنزيمي إلى انخفاض معدلات التمثيل الغذائي للدواء.[32] جمعية مجموعة واسعة من الأمراض التي تصيب الإنسان مثل السرطان، الأمراض المعدية (الإيدز، الجذام، التهاب الكبد، الخ) المناعة الذاتية، العصبية وأمراض أخرى كثيرة مع تعدد الأشكال المختلفة التي يمكن أن يتم حسب ذات الصلة علم الصيدلة الجيني أهداف لعلاج المخدرات.[33]
مرض
قد يتسبب SNP الفردي في مرض مندلي، على الرغم من أنه بالنسبة للأمراض المعقدة، لا تعمل SNPs بشكل فردي، بدلاً من ذلك، فهي تعمل بالتنسيق مع SNPs الأخرى لإظهار حالة مرضية كما لوحظ في هشاشة العظام.[34] كان أحد أولى النجاحات في هذا المجال هو العثور على طفرة أساسية واحدة في المنطقة غير المشفرة من APOC3 (جين صميم البروتين الشحمي C3) الذي يرتبط بمخاطر أعلى للإصابة بارتفاع شحوم الدم وتصلب الشرايين.[35]
يمكن أن يكون لجميع أنواع النيوكلوتايد (SNPs) نمط ظاهري يمكن ملاحظته أو يمكن أن يؤدي إلى مرض:
يمكن أن تظهر تعدد الأشكال في المناطق غير المشفرة في خطر أعلى للإصابة بالسرطان، [36] وقد تؤثر على بنية الرنا المرسال وقابلية الإصابة بالأمراض.[37] يمكن أن تغير SNPs غير المشفرة أيضًا مستوى التعبير عن الجين، مثل eQTL (التعبير عن موضع السمة الكمية).
لا تؤدي البدائل المترادفة بحكم التعريف إلى تغيير الأحماض الأمينية في البروتين، ولكنها لا تزال تؤثر على وظيفتها بطرق أخرى. من الأمثلة على ذلك حدوث طفرة صامتة على ما يبدو في جين المقاومة للأدوية المتعددة 1 (MDR1)، والذي يرمز لمضخة غشاء خلوي تطرد الأدوية من الخلية، ويمكن أن تبطئ الترجمة وتسمح لسلسلة الببتيد بالانطواء لتشكل غير عادي تكون المضخة الطافرة أقل فاعلية (في بروتين MDR1 على سبيل المثال يغير تعدد الأشكال C1236T كودون GGC إلى GGT في موضع الأحماض الأمينية 412 من عديد الببتيد (كلاهما يشفر الجلايسين) ويغير تعدد الأشكال C3435T ATC إلى ATT في الموضع 1145 (كلاهما يشفر isoleucine)).[38]
خطأ - يؤدي التغيير الفردي في القاعدة إلى تغيير في الأحماض الأمينية للبروتين وخللها الذي يؤدي إلى المرض (egc1580G> T SNP في جين LMNA - الموضع 1580 (nt) في تسلسل DNA (CGT codon) مما يؤدي إلى استبدال الجوانين مع الثايمين، ينتج كودون CTT في تسلسل الحمض النووي، ينتج على مستوى البروتين في استبدال الأرجينينبالليوسين في الموضع 527، [39] على مستوى النمط الظاهري، يتجلى هذا في تداخل خلل التنسج الفك السفلي ومتلازمة الشيخوخة المبكرة)
قامت مجموعة عمل خريطة SNP الدولية بتعيين التسلسل الذي يحيط بكل SNP من خلال المحاذاة مع التسلسل الجيني للنسخ كبيرة الإدراج في Genebank. تم تحويل هذه المحاذاة إلى إحداثيات كروموسومية كما هو موضح في الجدول 1.[51] زادت هذه القائمة بشكل كبير منذ ذلك الحين، على سبيل المثال، تسرد قاعدة بيانات Kaviar الآن 162 مليون متغير للنيوكليوتيدات المفردة (SNVs).
يمكن أن تكون التسمية الخاصة بـ SNPs مربكة: يمكن أن توجد العديد من الاختلافات لـ SNP الفردي، ولم يتم تحقيق الإجماع بعد.
معيار rs ### هو الذي تم تبنيه من قبل قاعدة بيانات تعدد أشكال النكليوتيدات الفردية (dbSNP) ويستخدم البادئة "rs"، لـ «مرجع SNP»، متبوعًا برقم فريد وتعسفي.[52] غالبًا ما يشار إلى SNPs برقم dbSNP rs الخاص بهم، كما في الأمثلة أعلاه.
تستخدم جمعية تباين الجينوم البشري (HGVS) معيارًا ينقل المزيد من المعلومات حول SNP. الأمثلة هي:
c.76A>T: لمنطقة التشفير"c"، متبوعًا برقم لموضع النيوكليوتيدات، متبوعًا باختصار من حرف واحد للنيوكليوتيدات (A، C، G، T أو U)، متبوعًا بعلامة أكبر من (">") للإشارة استبدال، متبوعًا باختصار النيوكليوتيد الذي يحل محل السابق
P": Ser123Arg.P" للبروتين، متبوعًا باختصار مكون من ثلاثة أحرف للحمض الأميني، متبوعًا برقم لموضع الحمض الأميني، متبوعًا باختصار الحمض الأميني الذي يحل محل الأول.
تحليل SNP
عادة ما تكون SNPs ثنائية النواة وبالتالي يسهل فحصها.[51] تتضمن الطرق التحليلية لاكتشاف أشكال تعدد الأشكال الجديدة واكتشاف أشكال تعدد الأشكال المعروفة:
مجموعة مهمة من SNPs هي تلك التي تتوافق مع الطفرات الخاطئة التي تسبب تغير الأحماض الأمينية على مستوى البروتين. يمكن أن يكون للطفرة النقطية لبقايا معينة تأثير مختلف على وظيفة البروتين (من عدم وجود تأثير إلى تعطيل وظيفته بالكامل). عادةً ما يكون للتغيير في الأحماض الأمينية ذات الحجم المماثل والخصائص الفيزيائية الكيميائية (مثل الاستبدال من الليوسين إلى الفالين) تأثير خفيف وعكس ذلك. وبالمثل، إذا عطلت SNP عناصر البنية الثانوية (مثل استبدال البرولين في منطقة ألفا الحلزونية)، فقد تؤثر هذه الطفرة عادةً على بنية البروتين ووظيفته بالكامل. باستخدام تلك القواعد البسيطة والعديد من القواعد المشتقة الأخرى للتعلم الآلي، تم تطوير مجموعة من البرامج للتنبؤ بتأثير SNP:
SIFT يوفر هذا البرنامج نظرة ثاقبة حول كيفية تأثير المختبر على خطأ أو طفرة غير مترادفة على وظيفة البروتين بناءً على الخصائص الفيزيائية للحمض الأميني وتماثل التسلسل.
تقدر LIST[57][58] (الهوية المحلية والأصناف المشتركة) الضرر المحتمل للطفرات الناتجة عن تغيير وظائف البروتين. ويستند إلى افتراض أن الاختلافات التي لوحظت في الأنواع وثيقة الصلة تكون أكثر أهمية عند تقييم الحفظ مقارنة بتلك الموجودة في الأنواع ذات الصلة البعيدة.
SNPViz[59] يوفر هذا البرنامج تمثيلًا ثلاثي الأبعاد للبروتين المصاب، مع تسليط الضوء على تغير الأحماض الأمينية حتى يتمكن الأطباء من تحديد الإمراضية للبروتين الطافرة.
^Barreiro LB؛ Laval G؛ Quach H؛ Patin E؛ Quintana-Murci L. (2008). "Natural selection has driven population differentiation in modern humans". Nature Genetics. ج. 40 ع. 3: 340–345. DOI:10.1038/ng.78. PMID:18246066.
^"Natural selection has driven population differentiation in modern humans". Nature Genetics. ج. 40 ع. 3: 340–5. مارس 2008. DOI:10.1038/ng.78. PMID:18246066.
^"Heterogeneous distribution of SNPs in the human genome: microsatellites as predictors of nucleotide diversity and divergence". Genomics. ج. 95 ع. 3: 151–9. مارس 2010. DOI:10.1016/j.ygeno.2009.12.003. PMID:20026267.
^"CYP2C9 genotype as a predictor of drug disposition in humans". Methods and Findings in Experimental and Clinical Pharmacology. ج. 26 ع. 6: 463–72. يوليو–أغسطس 2004. PMID:15349140.
^"Functional SNPs of the breast cancer resistance protein-therapeutic effects and inhibitor development". Cancer Letters. ج. 234 ع. 1: 73–80. مارس 2006. DOI:10.1016/j.canlet.2005.04.039. PMID:16303243.
^"Single-nucleotide polymorphism in genome-wide association of human population: A tool for broad spectrum service". Egyptian Journal of Medical Human Genetics. ج. 14 ع. 2: 123–134. أبريل 2013. DOI:10.1016/j.ejmhg.2012.08.001.
^"SNP-SNP interactions within APOE gene influence plasma lipids in postmenopausal osteoporosis". Rheumatology International. ج. 31 ع. 3: 421–3. مارس 2011. DOI:10.1007/s00296-010-1449-7. PMID:20340021.
^"DNA polymorphism adjacent to human apoprotein A-1 gene: relation to hypertriglyceridaemia". Lancet. ج. 1 ع. 8322: 444–6. فبراير 1983. DOI:10.1016/S0140-6736(83)91440-X. PMID:6131168.
^"Anger- and aggression-related traits are associated with polymorphisms in the 5-HT-2A gene". Journal of Affective Disorders. ج. 96 ع. 1–2: 75–81. نوفمبر 2006. DOI:10.1016/j.jad.2006.05.016. PMID:16814396.
^"Bitter taste study in a sardinian genetic isolate supports the association of phenylthiocarbamide sensitivity to the TAS2R38 bitter receptor gene". Chemical Senses. ج. 29 ع. 8: 697–702. أكتوبر 2004. DOI:10.1093/chemse/bjh074. PMID:15466815.
^National Center for Biotechnology Information, United States National Library of Medicine. 2015. NCBI dbSNP build 144 for human. Summary Page. "DBSNP Summary". مؤرشف من الأصل في 2017-09-10. اطلع عليه بتاريخ 2017-09-11.
^"Identification of base pairs in single-nucleotide polymorphisms by MutS protein-mediated capillary electrophoresis". Analytical Chemistry. ج. 78 ع. 6: 2035–8. مارس 2006. DOI:10.1021/ac0520386. PMID:16536443.
^"Genetic identification by mass spectrometric analysis of single-nucleotide polymorphisms: ternary encoding of genotypes". Analytical Chemistry. ج. 72 ع. 14: 3298–302. يوليو 2000. DOI:10.1021/ac991390e. PMID:10939403.