เทคโนโลยีการวิเคราะห์ลำดับพันธุกรรมสายยาว หรือ Long-Read Sequencing

เทคโนโลยีการวิเคราะห์ลำดับพันธุกรรมสายยาว หรือ Long-Read Sequencing

เทคโนโลยีการหาลำดับพันธุกรรมแบบ Long-Read หรือที่เรียกว่าการหาลำดับพันธุกรรมยุคที่สาม (Third-Generation Sequencing) เป็นการพัฒนาที่เปลี่ยนแปลงวงการจีโนมิกส์อย่างสำคัญ เทคโนโลยีนี้สามารถอ่าน DNA หรือ RNA ในรูปแบบที่ยาวต่อเนื่อง ซึ่งช่วยแก้ปัญหาที่พบในพื้นที่ที่ซับซ้อนหรือซ้ำกันในจีโนม เนื้อหานี้จะอธิบายพื้นฐานของเทคโนโลยีนี้ การทำงานเชิงเทคนิค และการใช้งานที่ทำให้เทคโนโลยีนี้มีความสำคัญในงานวิจัยสมัยใหม่

พื้นฐานของการหาลำดับพันธุกรรมแบบ Long-Read

ในเทคโนโลยีการหาลำดับแบบ Short-Read แบบดั้งเดิม DNA หรือ RNA จะถูกแบ่งเป็นชิ้นส่วนขนาดเล็กและทำการหาลำดับทีละส่วน จากนั้นจึงนำมาประกอบกลับด้วยกระบวนการคำนวณ วิธีนี้อาจมีปัญหาเมื่อต้องจัดการกับพื้นที่ที่มีการซ้ำกันสูงหรือมีความซับซ้อน

เทคโนโลยี Long-Read ช่วยแก้ปัญหานี้โดยการอ่านลำดับที่ยาวกว่า—บางครั้งยาวเกินกว่า 10,000 เบส—ซึ่งให้ข้อมูลที่ครอบคลุมและแม่นยำมากขึ้นสำหรับการวิเคราะห์จีโนม ปัจจุบันมีสองบริษัทหลักที่เป็นผู้นำในเทคโนโลยีนี้ ได้แก่:

  1. PacBio (Pacific Biosciences): โดดเด่นด้วยเทคโนโลยี Single Molecule, Real-Time (SMRT) Sequencing

  2. Oxford Nanopore Technologies (ONT): โดดเด่นด้วยอุปกรณ์ที่ใช้ระบบนาโนพอร์ (Nanopore-Based Sequencing)

การทำงานของเทคโนโลยี Long-Read Sequencing

  1. การเตรียมตัวอย่าง (Sample Preparation):

    • การสกัด DNA หรือ RNA: จำเป็นต้องใช้ DNA หรือ RNA ที่มีโมเลกุลขนาดใหญ่เพื่อรักษาความยาวของลำดับ

    • การเตรียมห้องสมุด (Library Preparation): ใช้กระบวนการเฉพาะที่ช่วยลดการแตกหักของลำดับและเพิ่มความยาวที่อ่านได้ เช่น การติดตั้ง Adapter (PacBio) หรือโปรตีน Motor (ONT)

  2. กระบวนการหาลำดับ:

    • PacBio SMRT Sequencing: เทคนิคนี้ใช้ DNA วงกลมที่จับกับไพรเมอร์และโพลิเมอเรส การอ่านลำดับเกิดขึ้นแบบเรียลไทม์เมื่อโพลิเมอเรสเพิ่มเบสที่ติดฉลากด้วยสารเรืองแสง

    • Oxford Nanopore Sequencing: DNA หรือ RNA ถูกส่งผ่านรูนาโนที่ฝังอยู่ในเมมเบรน โดยการเปลี่ยนแปลงกระแสไฟฟ้าขณะเบสผ่านรูนาโนจะถูกแปลงเป็นลำดับเบส

  3. ผลลัพธ์ของข้อมูล:

    • PacBio ให้ข้อมูลแบบ Continuous Long Reads (CLR) และ High-Fidelity Reads (HiFi) ที่มีความแม่นยำสูง

    • ONT ผลิตข้อมูลดิบที่แปลงเป็นลำดับด้วยกระบวนการ Base-Calling และยังสามารถอ่าน RNA ได้โดยตรง

คำศัพท์เชิงเทคนิคใน Long-Read Sequencing

  1. Read Length: ความยาวของลำดับ DNA หรือ RNA ที่อ่านได้ เทคโนโลยีนี้มักให้ลำดับที่ยาวกว่า 10 kb และบางครั้งเกินกว่า 100 kb

  2. Error Rate: อัตราความผิดพลาด ซึ่งในช่วงแรกเทคโนโลยี Long-Read มีอัตราผิดพลาดสูงกว่า แต่ปัจจุบันลดลงอย่างมากด้วยเทคโนโลยี HiFi (PacBio) และตัวประมวลผลของ ONT

  3. Coverage: จำนวนครั้งที่อ่านพื้นที่ของจีโนมซ้ำ การครอบคลุมที่ลึกช่วยลดข้อผิดพลาดและเพิ่มความแม่นยำ

  4. Structural Variants (SVs): การเปลี่ยนแปลงโครงสร้างขนาดใหญ่ในจีโนม เช่น การแทรก การลบ และการกลับด้าน ที่สามารถตรวจจับได้ด้วย Long-Read

  5. Epigenetics: การเปลี่ยนแปลงทางพันธุกรรมที่ไม่เกี่ยวข้องกับลำดับเบส เช่น เมทิลเลชัน ซึ่งสามารถตรวจจับได้โดยตรง

ข้อดีของเทคโนโลยี Long-Read Sequencing

  1. การแก้ปัญหาพื้นที่ซ้ำและโครงสร้างที่ซับซ้อน:

    • Long Reads สามารถอ่านพื้นที่ที่ซ้ำและตรวจจับ SVs ที่มักถูกมองข้ามได้

  2. De Novo Assembly:

    • การประกอบจีโนมใหม่โดยไม่ต้องใช้จีโนมอ้างอิง ซึ่งมีความสำคัญในการศึกษาสิ่งมีชีวิตที่ไม่ใช่โมเดล

  3. การวิเคราะห์ Epigenetics:

    • ตรวจจับการเปลี่ยนแปลงเมทิลเลชันได้โดยตรง

  4. Transcriptomics:

    • การอ่านลำดับ RNA แบบเต็ม (Iso-Seq) ช่วยวิเคราะห์การสลับสับเปลี่ยนทางพันธุกรรม (Alternative Splicing) ได้อย่างครอบคลุม

ความท้าทายของ Long-Read Sequencing

  1. ค่าใช้จ่าย: แม้ว่าจะลดลง แต่ต้นทุนต่อจีกะเบสยังคงสูงกว่าแพลตฟอร์มแบบ Short-Read

  2. อัตราความผิดพลาด: แม้จะปรับปรุงแล้ว แต่ยังคงมีความผิดพลาดสูงกว่าเทคโนโลยี Illumina

  3. การจัดเก็บและวิเคราะห์ข้อมูล: ข้อมูลที่ได้มีขนาดใหญ่ ทำให้ต้องมีโครงสร้างพื้นฐานด้านการคำนวณและความเชี่ยวชาญทางชีวสารสนเทศ

การใช้งานของ Long-Read Sequencing

  1. จีโนมมนุษย์:

    • การตรวจจับ SVs ที่เกี่ยวข้องกับโรคทางพันธุกรรม

    • การพัฒนาจีโนมอ้างอิงที่สมบูรณ์ เช่น โครงการ Telomere-to-Telomere (T2T)

  2. การวิจัยมะเร็ง:

    • การตรวจจับการกลายพันธุ์ในระดับโซมาติกและการเปลี่ยนแปลงทางพันธุกรรมอื่น ๆ

  3. จีโนมจุลินทรีย์:

    • การประกอบจีโนมของจุลินทรีย์ รวมถึงการใช้งานในเมตาจีโนมิกส์

  4. จีโนมเกษตร:

    • การปรับปรุงจีโนมพืชและศึกษาปฏิสัมพันธ์ระหว่างพืชกับเชื้อโรค

  5. โรคทางระบบประสาท:

    • การวิเคราะห์การขยายตัวของลำดับซ้ำและ SVs ที่เกี่ยวข้องกับโรค เช่น โรคฮันติงตันและออทิสติก (ASD)

แนวทางในอนาคต

  1. เพิ่มความแม่นยำ: การพัฒนาอัลกอริธึมแก้ไขความผิดพลาดและเคมีการหาลำดับ

  2. ลดต้นทุน: การพัฒนาแพลตฟอร์มที่มีค่าใช้จ่ายต่ำเพื่อให้เข้าถึงได้ง่ายขึ้น

  3. การรวมกับ Multi-Omics: การผสมผสานกับโปรตีโอมิกส์ เมแทบอลิกส์ และเอพิจีโนมิกส์เพื่อให้ได้ข้อมูลที่ครอบคลุม

  4. เครื่องมือแบบพกพา: เช่น MinION ของ ONT ที่ช่วยในการใช้งานภาคสนาม เช่น การศึกษาสัตว์ป่าและการระบาดของโรคติดเชื้อ

สรุป

เทคโนโลยีการหาลำดับพันธุกรรมแบบ Long-Read กำลังปฏิวัติวงการจีโนมิกส์ด้วยการแก้ไขข้อจำกัดของวิธีการแบบดั้งเดิม ความสามารถในการอ่านพื้นที่ที่ซับซ้อน ตรวจจับการเปลี่ยนแปลงทางพันธุกรรม และช่วยในการประกอบจีโนมใหม่ ทำให้เทคโนโลยีนี้เป็นเครื่องมือที่สำคัญในงานวิจัยและการประยุกต์ใช้ทางคลินิก ในอนาคต เทคโนโลยีนี้จะมีบทบาทสำคัญในการเปิดเผยความซับซ้อนของจีโนมและขับเคลื่อนนวัตกรรมในหลากหลายสาขาชีววิทยา


แหล่งอ้างอิง

https://www.pacb.com/blog/long-read-sequencing/

https://www.illumina.com/science/technology/next-generation-sequencing/long-read-sequencing.html

https://nanoporetech.com

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

การตรวจ NIPT หรือ Non-Invasive Prenatal Testing คืออะไร?

NIPT (Non-Invasive Prenatal Testing) การตรวจทางเลือกที่ปลอดภัยและแม่นยำสำหรับหญิงตั้งครรภ์ การตรวจคัดกรองก่อนคลอดบุตรมีความสำคัญอย่างมากในกา...