НОВИНИ

Аналіз ДНК тепер у 30 разів швидший

Аналіз днк

Дата: 05.22.2022

Автор тексту

Entropia WEB Studio

Університет Нового Південного Уельсу та Інститут медичних досліджень Гарвана (The University of New South Wales and the Garvan Institute of Medical) розробили новий формат комп’ютерних файлів для прискорення такого процесу як аналіз ДНК –  секвенування нанопор та покращили спеціалізоване лікування пацієнтів з раком та іншими захворюваннями.

Дослідження, опубліковане в журналі Nature Biotechnology, показало, що нещодавно розроблений формат SLOW5 може обробляти складне секвенування нанопор ДНК «більш ніж у 30 разів швидше», ніж попередній файловий формат, за іронією долі названий FAST5.

Нанопорове секвенування використовується для виявлення низки захворювань та допомагає медичним працівникам детально аналізувати зразки ДНК, щоб вони могли запропонувати індивідуальне лікування для хворих на рак.

Дані, отримані в результаті цього процесу, зазвичай записувалися у файлові формати FAST5, в результаті чого виходили великі файли розміром близько 1,3 терабайт, що еквівалентно приблизно 650 годин відео високої чіткості. За словами дослідників, через великий розмір комп’ютерів потрібно два тижні для обробки файлів FAST5.

Проте провідний автор та інженер з обчислювальних систем Інституту геноміки,  Гарвана Хасінда Гамаараччі сказав, що обробка даних для геному людини з використанням SLOW5 скорочується до половини дня.

Він пояснює, що, на відміну від FAST5, формат SLOW5 дозволяє виконувати паралельні обчислення, у яких кілька процесорів можуть одночасно виконувати кілька невеликих аналізів, розбитих більші, складні та повні набори даних.

“Ви можете уявити це як про спробу викопати дуже велику яму 10 людьми, але у них є лише одна лопата, яку вони мають використовувати разом. Так це було раніше з FAST5”, – сказав Гарвана Хасінда. “Але з SLOW5 кожен отримує власну лопату, і всі вони можуть копати одночасно і виконувати роботу набагато швидше.”

Формат FAST5 повільний, тому що до даних не можна звертатися паралельно. Він заснований на форматі ієрархічних даних, який був розроблений у 1990-х роках для роботи на машинах, які на той час мали лише один процесор, а не на сучасних машинах, що включають кілька процесорів.

«Ієрахічний формат даних також є універсальним, тоді як формат SLOW5 розроблений спеціально для цієї мети. Таким чином, з точки зору аналогії з копанням, ми також пропонуємо лопату, спеціально розроблену для даного типу ґрунту. І оскільки новий формат SLOW5 може бути при одночасному доступі кількох процесорів, час обробки скоротився в 30 разів».

За матеріалами
ZDnet

Більше матеріалів в блозі