เทคโนโลยีการวิเคราะห์ลำดับพันธุกรรมสายยาว หรือ Long-Read Sequencing
เทคโนโลยีการหาลำดับพันธุกรรมแบบ Long-Read หรือที่เรียกว่าการหาลำดับพันธุกรรมยุคที่สาม (Third-Generation Sequencing) เป็นการพัฒนาที่เปลี่ยนแปลงวงการจีโนมิกส์อย่างสำคัญ เทคโนโลยีนี้สามารถอ่าน DNA หรือ RNA ในรูปแบบที่ยาวต่อเนื่อง ซึ่งช่วยแก้ปัญหาที่พบในพื้นที่ที่ซับซ้อนหรือซ้ำกันในจีโนม เนื้อหานี้จะอธิบายพื้นฐานของเทคโนโลยีนี้ การทำงานเชิงเทคนิค และการใช้งานที่ทำให้เทคโนโลยีนี้มีความสำคัญในงานวิจัยสมัยใหม่
พื้นฐานของการหาลำดับพันธุกรรมแบบ Long-Read
ในเทคโนโลยีการหาลำดับแบบ Short-Read แบบดั้งเดิม DNA หรือ RNA จะถูกแบ่งเป็นชิ้นส่วนขนาดเล็กและทำการหาลำดับทีละส่วน จากนั้นจึงนำมาประกอบกลับด้วยกระบวนการคำนวณ วิธีนี้อาจมีปัญหาเมื่อต้องจัดการกับพื้นที่ที่มีการซ้ำกันสูงหรือมีความซับซ้อน
เทคโนโลยี Long-Read ช่วยแก้ปัญหานี้โดยการอ่านลำดับที่ยาวกว่า—บางครั้งยาวเกินกว่า 10,000 เบส—ซึ่งให้ข้อมูลที่ครอบคลุมและแม่นยำมากขึ้นสำหรับการวิเคราะห์จีโนม ปัจจุบันมีสองบริษัทหลักที่เป็นผู้นำในเทคโนโลยีนี้ ได้แก่:
PacBio (Pacific Biosciences): โดดเด่นด้วยเทคโนโลยี Single Molecule, Real-Time (SMRT) Sequencing
Oxford Nanopore Technologies (ONT): โดดเด่นด้วยอุปกรณ์ที่ใช้ระบบนาโนพอร์ (Nanopore-Based Sequencing)
การทำงานของเทคโนโลยี Long-Read Sequencing
การเตรียมตัวอย่าง (Sample Preparation):
การสกัด DNA หรือ RNA: จำเป็นต้องใช้ DNA หรือ RNA ที่มีโมเลกุลขนาดใหญ่เพื่อรักษาความยาวของลำดับ
การเตรียมห้องสมุด (Library Preparation): ใช้กระบวนการเฉพาะที่ช่วยลดการแตกหักของลำดับและเพิ่มความยาวที่อ่านได้ เช่น การติดตั้ง Adapter (PacBio) หรือโปรตีน Motor (ONT)
กระบวนการหาลำดับ:
PacBio SMRT Sequencing: เทคนิคนี้ใช้ DNA วงกลมที่จับกับไพรเมอร์และโพลิเมอเรส การอ่านลำดับเกิดขึ้นแบบเรียลไทม์เมื่อโพลิเมอเรสเพิ่มเบสที่ติดฉลากด้วยสารเรืองแสง
Oxford Nanopore Sequencing: DNA หรือ RNA ถูกส่งผ่านรูนาโนที่ฝังอยู่ในเมมเบรน โดยการเปลี่ยนแปลงกระแสไฟฟ้าขณะเบสผ่านรูนาโนจะถูกแปลงเป็นลำดับเบส
ผลลัพธ์ของข้อมูล:
PacBio ให้ข้อมูลแบบ Continuous Long Reads (CLR) และ High-Fidelity Reads (HiFi) ที่มีความแม่นยำสูง
ONT ผลิตข้อมูลดิบที่แปลงเป็นลำดับด้วยกระบวนการ Base-Calling และยังสามารถอ่าน RNA ได้โดยตรง
คำศัพท์เชิงเทคนิคใน Long-Read Sequencing
Read Length: ความยาวของลำดับ DNA หรือ RNA ที่อ่านได้ เทคโนโลยีนี้มักให้ลำดับที่ยาวกว่า 10 kb และบางครั้งเกินกว่า 100 kb
Error Rate: อัตราความผิดพลาด ซึ่งในช่วงแรกเทคโนโลยี Long-Read มีอัตราผิดพลาดสูงกว่า แต่ปัจจุบันลดลงอย่างมากด้วยเทคโนโลยี HiFi (PacBio) และตัวประมวลผลของ ONT
Coverage: จำนวนครั้งที่อ่านพื้นที่ของจีโนมซ้ำ การครอบคลุมที่ลึกช่วยลดข้อผิดพลาดและเพิ่มความแม่นยำ
Structural Variants (SVs): การเปลี่ยนแปลงโครงสร้างขนาดใหญ่ในจีโนม เช่น การแทรก การลบ และการกลับด้าน ที่สามารถตรวจจับได้ด้วย Long-Read
Epigenetics: การเปลี่ยนแปลงทางพันธุกรรมที่ไม่เกี่ยวข้องกับลำดับเบส เช่น เมทิลเลชัน ซึ่งสามารถตรวจจับได้โดยตรง
ข้อดีของเทคโนโลยี Long-Read Sequencing
การแก้ปัญหาพื้นที่ซ้ำและโครงสร้างที่ซับซ้อน:
Long Reads สามารถอ่านพื้นที่ที่ซ้ำและตรวจจับ SVs ที่มักถูกมองข้ามได้
De Novo Assembly:
การประกอบจีโนมใหม่โดยไม่ต้องใช้จีโนมอ้างอิง ซึ่งมีความสำคัญในการศึกษาสิ่งมีชีวิตที่ไม่ใช่โมเดล
การวิเคราะห์ Epigenetics:
ตรวจจับการเปลี่ยนแปลงเมทิลเลชันได้โดยตรง
Transcriptomics:
การอ่านลำดับ RNA แบบเต็ม (Iso-Seq) ช่วยวิเคราะห์การสลับสับเปลี่ยนทางพันธุกรรม (Alternative Splicing) ได้อย่างครอบคลุม
ความท้าทายของ Long-Read Sequencing
ค่าใช้จ่าย: แม้ว่าจะลดลง แต่ต้นทุนต่อจีกะเบสยังคงสูงกว่าแพลตฟอร์มแบบ Short-Read
อัตราความผิดพลาด: แม้จะปรับปรุงแล้ว แต่ยังคงมีความผิดพลาดสูงกว่าเทคโนโลยี Illumina
การจัดเก็บและวิเคราะห์ข้อมูล: ข้อมูลที่ได้มีขนาดใหญ่ ทำให้ต้องมีโครงสร้างพื้นฐานด้านการคำนวณและความเชี่ยวชาญทางชีวสารสนเทศ
การใช้งานของ Long-Read Sequencing
จีโนมมนุษย์:
การตรวจจับ SVs ที่เกี่ยวข้องกับโรคทางพันธุกรรม
การพัฒนาจีโนมอ้างอิงที่สมบูรณ์ เช่น โครงการ Telomere-to-Telomere (T2T)
การวิจัยมะเร็ง:
การตรวจจับการกลายพันธุ์ในระดับโซมาติกและการเปลี่ยนแปลงทางพันธุกรรมอื่น ๆ
จีโนมจุลินทรีย์:
การประกอบจีโนมของจุลินทรีย์ รวมถึงการใช้งานในเมตาจีโนมิกส์
จีโนมเกษตร:
การปรับปรุงจีโนมพืชและศึกษาปฏิสัมพันธ์ระหว่างพืชกับเชื้อโรค
โรคทางระบบประสาท:
การวิเคราะห์การขยายตัวของลำดับซ้ำและ SVs ที่เกี่ยวข้องกับโรค เช่น โรคฮันติงตันและออทิสติก (ASD)
แนวทางในอนาคต
เพิ่มความแม่นยำ: การพัฒนาอัลกอริธึมแก้ไขความผิดพลาดและเคมีการหาลำดับ
ลดต้นทุน: การพัฒนาแพลตฟอร์มที่มีค่าใช้จ่ายต่ำเพื่อให้เข้าถึงได้ง่ายขึ้น
การรวมกับ Multi-Omics: การผสมผสานกับโปรตีโอมิกส์ เมแทบอลิกส์ และเอพิจีโนมิกส์เพื่อให้ได้ข้อมูลที่ครอบคลุม
เครื่องมือแบบพกพา: เช่น MinION ของ ONT ที่ช่วยในการใช้งานภาคสนาม เช่น การศึกษาสัตว์ป่าและการระบาดของโรคติดเชื้อ
สรุป
เทคโนโลยีการหาลำดับพันธุกรรมแบบ Long-Read กำลังปฏิวัติวงการจีโนมิกส์ด้วยการแก้ไขข้อจำกัดของวิธีการแบบดั้งเดิม ความสามารถในการอ่านพื้นที่ที่ซับซ้อน ตรวจจับการเปลี่ยนแปลงทางพันธุกรรม และช่วยในการประกอบจีโนมใหม่ ทำให้เทคโนโลยีนี้เป็นเครื่องมือที่สำคัญในงานวิจัยและการประยุกต์ใช้ทางคลินิก ในอนาคต เทคโนโลยีนี้จะมีบทบาทสำคัญในการเปิดเผยความซับซ้อนของจีโนมและขับเคลื่อนนวัตกรรมในหลากหลายสาขาชีววิทยา
แหล่งอ้างอิง
https://www.pacb.com/blog/long-read-sequencing/
https://www.illumina.com/science/technology/next-generation-sequencing/long-read-sequencing.html
ความคิดเห็น
แสดงความคิดเห็น