基于擬比對CNN方法的人類p53癌癥基因二級數據庫構建及分析
摘要:以NCBI維護的一級數據庫為數據源建立人類癌癥p53核苷酸序列二級數據庫,該數據庫設計主要包括4個方面:癌癥信息、p53序列信息、樣本信息和參考文獻信息。以XML格式為中間格式保存一級數據庫數據,并通過解析提交到二級數據庫,初步實現數據的檢索、鏈接和統計分析等功能。本文提出一種擬比對CNN方法對p53癌癥基因序列進行比對分析,通過改善傳統CNN相似度評估公式,增強兩序列全局比對相似度的敏感性和可靠性。結果表明,將改進的序列比對算法應用于乳腺癌和非小細胞肺癌p53外顯子基因序列比對,發現外顯子5突變后序列比對結果存在較大差異,可以作為區別這兩種癌癥的參考。此外,通過將一級數據庫以XML形式轉化成二級數據庫,實現了網絡數據與本地數據的動態交換。
注: 保護知識產權,如需閱讀全文請聯系食品與生物技術學報雜志社