Zlatý grál, proteiny a softwarové inženýrství. David Hoksza převzal Cenu Bernarda Bolzana v oboru informatika ****************************************************************************************** * Zlatý grál, proteiny a softwarové inženýrství. David Hoksza převzal Cenu Bernarda Bolzan informatika ****************************************************************************************** Zatímco starověcí učenci filozofovali při chůzi olivovým hájem, jak praví staré knihy, Dav chůze nestačí, nejraději přemýšlí ve zrychleném režimu organizmu, tedy při běhu. A přináší nejprve v podobě magisterského diplomu z MFF UK v době studií, a naposledy před pár týdny, fond Bernarda Bolzana udělil výroční cenu za rok 2010 v oboru informatika. RNDr. David Hok Katedry softwarového inženýrství MFF UK ji převzal na zasedání vědecké rady MFF UK 9. únor RNDr. David Hoksza, Ph.D.Co je konkrétně předmětem práce „Density-based classification of softwarového inženýrství,iterative TM-score,“ za kterou jste právě obdržel výroční cenu Be S rozvojem bioinformatiky a vědy o proteinech se zvyšuje i tlak n vyhledávání v databázích proteinových struktur a sekvencí nebo ob případ – jsem chemik nebo biolog a zjistím určitou strukturu prot vědět, k čemu ta bílkovina slouží. Protože vím, že funkčně podobn strukturu, vezmu tuto proteinovou strukturu s neznámou funkcí a p struktur se známou funkcí. A když najdu strukturně co nejpodobněj jaká by mohla být funkce mého nově nalezeného proteinu. A tím se zabývala moje disertace – vyhledáváním v takových databázích. Navrhl jsem určitý reprezentovat proteinové struktury, a model vhodný k tomu, aby se na něm dobře prováděly p operace. Prakticky to vypadá tak, že si navrhnu nějaký model a na něm nadefinuji operaci p dokázal říct o dvou proteinových strukturách, potažmo modelech, které je reprezentují, jak To pak můžu využít při efektivním prohledávání databází proteinových struktur. K čemu, kromě usnadnění vyhledávání a zefektivnění operací v databázích, bude výsledek vaš širší praxi? Obecně se podobnost proteinových struktur může použít jak pro zjištění funkce nově nalezen tak i v širším kontextu, jako je například „zlatý grál“ proteomiky, což je predikce protei sekvence. Řekněme, že máme nějakou bílkovinu, známe její sekvenci a chceme vědět, co by se nějakou aminokyselinu zaměnili za jinou, jak by se změnila její proteinová struktura. A ta výrazně používá modelování podobnosti proteinových struktur. Takže podobnost proteinových použít jako částečný modul v algoritmech pro predikci proteinové struktury. Proč je predikce proteinové struktury „zlatým grálem“ proteomiky? Zlatým grálem je proto, protože má neobyčejně významné uplatnění v biologii, lékařství a p farmacii ve vývoji léčiv. Modelový příklad, který jsem před chvíli zmínil, se uvádí nejčas určení funkce nové struktury se rovná faktickému použití metody 1 :1, zatímco když budu dě proteinové struktury, bude to jen modul v celém aparátu predikce proteinových struktur. Má vaše práce, tak jak vy sám ji vidíte, nějaké slabiny či nedořešená místa nebo je to nao dokončená metoda? Slabiny má v.... A můžeme je tu říkat? Můžeme, já jsem o tom psal i ve své disertaci. Chtěl bych, aby byla efektivnější, co se tý Není pomalá, ale její slabina je v tom, že s růstem databází proteinových struktur se tato zpomalovat, protože je sekvenční, rychlost není logaritmická vzhledem k velikosti databáze na tom s mými kolegy ve výzkumné skupině SIRET, (SImilarity RETrieval) research group (SRG se právě efektivními metodami indexování/vyhledávání ať už indexování ve smyslu rychlého v v databázích buď na obecné úrovni, kdy vyvíjíme struktury pro rychlé vyhledávání, nebo tím částečně aplikovaný výzkum, kde se snažíme tyto metody uplatnit v určité specifické doméně biologii, což dělám já. Až nějaký lékařský tým dostane Nobelovu cenu za výzkum proteinů, vaše jméno tam zřejmě neb a nikdo z nich si ani neuvědomí, jak měli díky vaší metodě usnadněnou práci a zkrácenou ce hledání, o času nemluvě. Ano, to je pravda, ale stejně jako když někdo bude ke své práci používat excel a získá svě vývojářům excelu se uznání také nedostane. Vás právě ocenila Nadace Bernarda Bolzana, což je skvělé zahájení vědecké kariéry. Jak doš jste zvolil právě tohle téma? Byla to objednávka z praxe, třeba zadání od biologů, nebo má osobní vztah? K biologii nemám vztah ani záporný, ale neměl jsem ani výrazně kladný - že bych si jako ma pipetou, to zase ne, ale samozřejmě mě zajímá, jak ty věci fungují. Jednoduše, vybral jsem své disertační práce. Vystudoval jsem na Katedře softwarového inženýrství MFF UK datové in jsou zjednodušeně řečeno databáze, a chtěl jsem dál pokračovat v doktorském studiu. Snažil najít spíš oblast aplikovaného výzkumu, abych se nezabýval datovými strukturami jen ve vzd doc. RNDr. Tomáš Skopal, Ph.D., který vedl mou disertační práci, zrovna navrhl téma Podobn v biologických databázích. A protože on sám právě pracuje na indexovacích strukturách obec byla to o tom zkusit je aplikovat, aby byly někde využité, protože to jsou dobré, efektivn Takže k tématu jsem se dostal spojením těchto dvou domén a stálo mě to hodně úsilí a hodně problematiky proteinů dostat. Tak že teď máte jako vedlejší specializaci proteinové struktury? ... (smích)... Skoro, i když biologové nebo chemici by s tím určitě nesouhlasili, protože nemůžu dosáhnout takové hloubky znalostí, jaké mají oni a ani to nepotřebuji. Snažím se ab specifičnosti domény a pak pracovat s těmi modely, které nad tím vytvořím, takže jdu jen t dokázal efektivní modely vytvořit a nad nimi pracovat. Mluvil jste o abstrakci, hledání vyšších obecných struktur a podstaty funkcí mnohého. Kde badatelské práci čistých idejí prostor pro vášeň? - vždyť ani matematik jí nezůstane ušetř Myslím, že bez vášně se vědecká práce dělat nedá. Nevím, jestli se tomu tak dá říkat, ale o tom, že člověk rád rozebírá věci a dokáže se do problému intenzivně ponořit, nemyslí na a v jistém smyslu je od světa odtržen. Já například rád přemýšlím, když si jdu zaběhat. V nevnímám a často si přemýšlím nad matematickými problémy. Začalo to v době magisterského s před zkouškami chodil běhat a učil jsem se, ne ve smyslu biflování, ale pochopení věcí. Čl odstřihne od reality a promílá si to v hlavě - a to mi pomáhá přímo úžasně. Děkuji za rozhovor. (Marie Kohoutová)