ข้ามไปที่เนื้อหาหลัก

เทคโนโลยีการวิเคราะห์ลำดับพันธุกรรมสายยาว หรือ Long-Read Sequencing

เทคโนโลยีการวิเคราะห์ลำดับพันธุกรรมสายยาว หรือ Long-Read Sequencing

เทคโนโลยีการหาลำดับพันธุกรรมแบบ Long-Read หรือที่เรียกว่าการหาลำดับพันธุกรรมยุคที่สาม (Third-Generation Sequencing) เป็นการพัฒนาที่เปลี่ยนแปลงวงการจีโนมิกส์อย่างสำคัญ เทคโนโลยีนี้สามารถอ่าน DNA หรือ RNA ในรูปแบบที่ยาวต่อเนื่อง ซึ่งช่วยแก้ปัญหาที่พบในพื้นที่ที่ซับซ้อนหรือซ้ำกันในจีโนม เนื้อหานี้จะอธิบายพื้นฐานของเทคโนโลยีนี้ การทำงานเชิงเทคนิค และการใช้งานที่ทำให้เทคโนโลยีนี้มีความสำคัญในงานวิจัยสมัยใหม่

พื้นฐานของการหาลำดับพันธุกรรมแบบ Long-Read

ในเทคโนโลยีการหาลำดับแบบ Short-Read แบบดั้งเดิม DNA หรือ RNA จะถูกแบ่งเป็นชิ้นส่วนขนาดเล็กและทำการหาลำดับทีละส่วน จากนั้นจึงนำมาประกอบกลับด้วยกระบวนการคำนวณ วิธีนี้อาจมีปัญหาเมื่อต้องจัดการกับพื้นที่ที่มีการซ้ำกันสูงหรือมีความซับซ้อน

เทคโนโลยี Long-Read ช่วยแก้ปัญหานี้โดยการอ่านลำดับที่ยาวกว่า—บางครั้งยาวเกินกว่า 10,000 เบส—ซึ่งให้ข้อมูลที่ครอบคลุมและแม่นยำมากขึ้นสำหรับการวิเคราะห์จีโนม ปัจจุบันมีสองบริษัทหลักที่เป็นผู้นำในเทคโนโลยีนี้ ได้แก่:

  1. PacBio (Pacific Biosciences): โดดเด่นด้วยเทคโนโลยี Single Molecule, Real-Time (SMRT) Sequencing

  2. Oxford Nanopore Technologies (ONT): โดดเด่นด้วยอุปกรณ์ที่ใช้ระบบนาโนพอร์ (Nanopore-Based Sequencing)

การทำงานของเทคโนโลยี Long-Read Sequencing

  1. การเตรียมตัวอย่าง (Sample Preparation):

    • การสกัด DNA หรือ RNA: จำเป็นต้องใช้ DNA หรือ RNA ที่มีโมเลกุลขนาดใหญ่เพื่อรักษาความยาวของลำดับ

    • การเตรียมห้องสมุด (Library Preparation): ใช้กระบวนการเฉพาะที่ช่วยลดการแตกหักของลำดับและเพิ่มความยาวที่อ่านได้ เช่น การติดตั้ง Adapter (PacBio) หรือโปรตีน Motor (ONT)

  2. กระบวนการหาลำดับ:

    • PacBio SMRT Sequencing: เทคนิคนี้ใช้ DNA วงกลมที่จับกับไพรเมอร์และโพลิเมอเรส การอ่านลำดับเกิดขึ้นแบบเรียลไทม์เมื่อโพลิเมอเรสเพิ่มเบสที่ติดฉลากด้วยสารเรืองแสง

    • Oxford Nanopore Sequencing: DNA หรือ RNA ถูกส่งผ่านรูนาโนที่ฝังอยู่ในเมมเบรน โดยการเปลี่ยนแปลงกระแสไฟฟ้าขณะเบสผ่านรูนาโนจะถูกแปลงเป็นลำดับเบส

  3. ผลลัพธ์ของข้อมูล:

    • PacBio ให้ข้อมูลแบบ Continuous Long Reads (CLR) และ High-Fidelity Reads (HiFi) ที่มีความแม่นยำสูง

    • ONT ผลิตข้อมูลดิบที่แปลงเป็นลำดับด้วยกระบวนการ Base-Calling และยังสามารถอ่าน RNA ได้โดยตรง

คำศัพท์เชิงเทคนิคใน Long-Read Sequencing

  1. Read Length: ความยาวของลำดับ DNA หรือ RNA ที่อ่านได้ เทคโนโลยีนี้มักให้ลำดับที่ยาวกว่า 10 kb และบางครั้งเกินกว่า 100 kb

  2. Error Rate: อัตราความผิดพลาด ซึ่งในช่วงแรกเทคโนโลยี Long-Read มีอัตราผิดพลาดสูงกว่า แต่ปัจจุบันลดลงอย่างมากด้วยเทคโนโลยี HiFi (PacBio) และตัวประมวลผลของ ONT

  3. Coverage: จำนวนครั้งที่อ่านพื้นที่ของจีโนมซ้ำ การครอบคลุมที่ลึกช่วยลดข้อผิดพลาดและเพิ่มความแม่นยำ

  4. Structural Variants (SVs): การเปลี่ยนแปลงโครงสร้างขนาดใหญ่ในจีโนม เช่น การแทรก การลบ และการกลับด้าน ที่สามารถตรวจจับได้ด้วย Long-Read

  5. Epigenetics: การเปลี่ยนแปลงทางพันธุกรรมที่ไม่เกี่ยวข้องกับลำดับเบส เช่น เมทิลเลชัน ซึ่งสามารถตรวจจับได้โดยตรง

ข้อดีของเทคโนโลยี Long-Read Sequencing

  1. การแก้ปัญหาพื้นที่ซ้ำและโครงสร้างที่ซับซ้อน:

    • Long Reads สามารถอ่านพื้นที่ที่ซ้ำและตรวจจับ SVs ที่มักถูกมองข้ามได้

  2. De Novo Assembly:

    • การประกอบจีโนมใหม่โดยไม่ต้องใช้จีโนมอ้างอิง ซึ่งมีความสำคัญในการศึกษาสิ่งมีชีวิตที่ไม่ใช่โมเดล

  3. การวิเคราะห์ Epigenetics:

    • ตรวจจับการเปลี่ยนแปลงเมทิลเลชันได้โดยตรง

  4. Transcriptomics:

    • การอ่านลำดับ RNA แบบเต็ม (Iso-Seq) ช่วยวิเคราะห์การสลับสับเปลี่ยนทางพันธุกรรม (Alternative Splicing) ได้อย่างครอบคลุม

ความท้าทายของ Long-Read Sequencing

  1. ค่าใช้จ่าย: แม้ว่าจะลดลง แต่ต้นทุนต่อจีกะเบสยังคงสูงกว่าแพลตฟอร์มแบบ Short-Read

  2. อัตราความผิดพลาด: แม้จะปรับปรุงแล้ว แต่ยังคงมีความผิดพลาดสูงกว่าเทคโนโลยี Illumina

  3. การจัดเก็บและวิเคราะห์ข้อมูล: ข้อมูลที่ได้มีขนาดใหญ่ ทำให้ต้องมีโครงสร้างพื้นฐานด้านการคำนวณและความเชี่ยวชาญทางชีวสารสนเทศ

การใช้งานของ Long-Read Sequencing

  1. จีโนมมนุษย์:

    • การตรวจจับ SVs ที่เกี่ยวข้องกับโรคทางพันธุกรรม

    • การพัฒนาจีโนมอ้างอิงที่สมบูรณ์ เช่น โครงการ Telomere-to-Telomere (T2T)

  2. การวิจัยมะเร็ง:

    • การตรวจจับการกลายพันธุ์ในระดับโซมาติกและการเปลี่ยนแปลงทางพันธุกรรมอื่น ๆ

  3. จีโนมจุลินทรีย์:

    • การประกอบจีโนมของจุลินทรีย์ รวมถึงการใช้งานในเมตาจีโนมิกส์

  4. จีโนมเกษตร:

    • การปรับปรุงจีโนมพืชและศึกษาปฏิสัมพันธ์ระหว่างพืชกับเชื้อโรค

  5. โรคทางระบบประสาท:

    • การวิเคราะห์การขยายตัวของลำดับซ้ำและ SVs ที่เกี่ยวข้องกับโรค เช่น โรคฮันติงตันและออทิสติก (ASD)

แนวทางในอนาคต

  1. เพิ่มความแม่นยำ: การพัฒนาอัลกอริธึมแก้ไขความผิดพลาดและเคมีการหาลำดับ

  2. ลดต้นทุน: การพัฒนาแพลตฟอร์มที่มีค่าใช้จ่ายต่ำเพื่อให้เข้าถึงได้ง่ายขึ้น

  3. การรวมกับ Multi-Omics: การผสมผสานกับโปรตีโอมิกส์ เมแทบอลิกส์ และเอพิจีโนมิกส์เพื่อให้ได้ข้อมูลที่ครอบคลุม

  4. เครื่องมือแบบพกพา: เช่น MinION ของ ONT ที่ช่วยในการใช้งานภาคสนาม เช่น การศึกษาสัตว์ป่าและการระบาดของโรคติดเชื้อ

สรุป

เทคโนโลยีการหาลำดับพันธุกรรมแบบ Long-Read กำลังปฏิวัติวงการจีโนมิกส์ด้วยการแก้ไขข้อจำกัดของวิธีการแบบดั้งเดิม ความสามารถในการอ่านพื้นที่ที่ซับซ้อน ตรวจจับการเปลี่ยนแปลงทางพันธุกรรม และช่วยในการประกอบจีโนมใหม่ ทำให้เทคโนโลยีนี้เป็นเครื่องมือที่สำคัญในงานวิจัยและการประยุกต์ใช้ทางคลินิก ในอนาคต เทคโนโลยีนี้จะมีบทบาทสำคัญในการเปิดเผยความซับซ้อนของจีโนมและขับเคลื่อนนวัตกรรมในหลากหลายสาขาชีววิทยา


แหล่งอ้างอิง

https://www.pacb.com/blog/long-read-sequencing/

https://www.illumina.com/science/technology/next-generation-sequencing/long-read-sequencing.html

https://nanoporetech.com

ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

หลอดใส่เลือดมี่กี่ชนิด (tube เลือดมี่กี่ชนิด)

        หลาย ๆ ท่านอาจสงสัยนะครับว่าเวลามีนัดต้องไปพบแพทย์ และเมื่อถึงเวลาเจาะเลือด ทำไมถึงต้องเก็บเลือดเราไปทีละหลาย ๆ หลอดและในการนัดแต่ละครั้งก็มีการเจาะเลือดไปไม่เหมือนเดิมกับครั้งก่อน วันนี้เราจะมาทำความเข้าใจกันครับว่าหลอดใส่เลือดแต่ละแบบมีความแตกต่างกันอย่างไร         ปัจจุบันในทางการแพทย์หลอดสำหรับเก็บตัวอย่างเลือดนั้นถูกพัฒนามาหลายรูปแบบด้วยกัน เพื่อให้มีประสิทธิภาพสำหรับตรวจทางห้องปฏิบัติการรวมถึงระยะในการเก็บรักษาตัวอย่างเลือดให้มีความเหมาะสม และมีประสิทธิภาพสูงสุดตามวัตถุประสงค์ของการตรวจทางห้องปฏิบัติการครับ สำหรับในวันนี้จะพามาทำความรู้จักกับหลอดเลือดพื้นฐานที่ใช้ในการตรวจประจำของโรงพยาบาลโดยทั่วไปครับ  สิ่งที่อยู่ในหลอดเลือดแต่ละสี        สิ่งที่อยู่ข้างในหลอดเลือดสีต่าง ๆ คือ สารเคมีที่ป้องกันการแข็งตัวของเลือด (สารกันเลือดแข็ง) โดยในหลอดแต่ละสีก็จะมีสารกันเลือดแข็งคนละชนิดกันครับ ซึ่งสาเหตุที่ต้องใช้สารกันเลือดแข็งหลายชนิด ไม่สามารถใช้ชนิดเดียว หรือหลอดเดียวสำหรับารตรวจได้ทั้งหมดก็เพราะว่าส...

DNA ตอนที่ 1 : DNA คืออะไร และโครงสร้างของ DNA

สารพันธุกรรม (genetic materials) ห มายถึงสารที่ทำหน้าที่เก็บข้อมูลพื้นฐานของสิ่งมีชีวิตทั้งสิ่งมีชีวิตระดับโปรคาริโอต (prokaryote) และยูคาริโอต (eukaryote) โดยสารพันธุกรรมประกอบด้วย ดีเอ็นเอ (deoxyribonucleic acid หรือ DNA) และอาร์เอ็นเอ (ribonucleic acid หรือ RNA) การเก็บรักษาข้อมูลพื้นฐานของสิ่งมีชีวิตเกิดจากการเรียงลำดับของหน่อยย่อยที่สุดของ DNA และ RNA อย่างเป็นระเบียบและมีความหมาย ซึ่งหน่อยย่อยของดีเอ็นเอและอาร์เอ็นเอเราเรียกว่า นิวคลีโอไทด์ (nucleotide) สิ่งมีชีวิตจะทำการแปลรหัสข้อมูลนิวคลีโอไทด์เหล่านี้ออกมาเป็นโปรตีนเพื่อทำหน้าที่ต่าง ๆ ของเซลล์หรือร่างกายของสิ่งมีชีวิตต่อไปผ่านการทำงานร่วมกันตั้งแต่ DNA RNA ไปจนถึงขั้นตอนการสั่งเคราะห์โปรตีน อย่างไรก็ตามสิ่งมีชีวิตบางประเภทจะเก็บข้อมูลพื้นฐานของตัวเองในรูปแบบของ RNA เท่านั้น เช่นไวรัสในกลุ่มรีโทรไวรัส หรือที่เรารู้จักกันดีก็คือไวรัสโควิด ภาพที่ 1 แสดงโครงสร้างจำลองของ DNA ที่มาภาพ : http://becuo.com/red-dna-wallpaper   DNA (deoxyribonucleic acid )                  D...

ความแตกต่างระหว่าง Leukemoid Reaction และ Chronic myeloid leukemia (CML)

***แก้ไขหน่วยในภาพ cell/ml เป็น cell/ul Leukemoid Reaction (LR) คือ ภาวะหนึ่งที่ร่างกายมีการสร้างเม็ดเลือดขาวออกมาในปริมาณมาก (>50,000 cell/ul) เพื่อตอบสนองต่อ ภาวะความผิดปกติบางอย่าง เช่นภาวะการติดเชื้ออย่างรุนแรง (severe infection)  เม็ดเลือดขาวที่เพิ่มขึ้นผิดปกติจำนวนมากจะเป็น mature cells  แต่ก็อาจพบเม็ดเลือดขาวระยะตัวอ่อนได้บ้างซึ่งการที่เราพบเม็ดเลือดตัวอ่อนในเลือดจะเรียกว่า Shift to the left  โดยเมื่อส่องดูเสมียร์เลือด (blood smear) ด้วยกล้องจุลทรรศน์แล้วจะพบว่ามีลักษณะที่คล้ายกับโรคมะเร็งเม็ดเลือดขาวชนิด Chronic myeloid leukemia (CML) แต่ก็มีลักษณะที่สามารถทำให้แยกออกจากกันได้ครับโดยการวินิจฉัย LR นั้นจะเป็น exclusion criteria ของมะเร็งเม็ดเลือดขาว CML เช่น ความผิดปกติของเม็ดเลือดแดง เกร็ดเลือด และชนิดของเม็ดเลือดขาวตัวเต็มวัย หรือการเพิ่มขึ้นของค่า  Leukocyte alkaline phosphatase (LAP)  ใน LR Chronic myeloid leukemia (CML) เป็นมะเร็งเม็ดเลือดขาวในสาย myeloid ชนิดเรื้องรัง โดยผู้ป่วย CML ส่วนใหญ่มีสาเหตุการเกิดโรคมาจากการกลายพั...