暑期学习之生物序列模体发现算法研究基础（二） - 代码天地

暑期学习之生物序列模体发现算法研究基础（二）

其他 2018-07-25 18:10:20 阅读次数: 0

本文的主要任务主要是把上篇遗留的问题给解决n(≧▽≦)n

模体发现的难度评测

2d邻居概率
E(l, d)值

先说2d邻居概率，它是这么一个意思，表示任意的两个l-mer的海明距离小于等于2d的概率，用 $p_{2d}$ 表示。 $p_{2d}$ 越大，说明背景序列对模体发现的干扰性越大。(l, d)模体的性质：任意的两个模体实例的海明距离小于等于2d 。

公式如下：

首先求和的部分，总概率是把海明距离从0到2d的所有的概率加起来共同的概率之和。长为 l 的模体共|∑|的 l 次方种可能，那么跟他有i个差异的另一个模体的概率为分子部分，并且是随机从 l 里取i个，所以正好的 $C_{l}^{i}$ 种可能。组合起来，正是上式。

然后是E(l, d)值 ，他表示t条长为n的序列集合中包含的（l,d）模体的期望个数。直接在下面先给出公式（为什么会有我自己的水印我也不知道.....）：

首先分为两个部分，括号外面的是一共有多少种模体的可能性，里面是每一个是l-mer是模体的概率。 $p_d$ 表示的意思是（l, d)模体在随机序列中的随机位置上以最大d个位置差异出现的概率。（1- $p_d$ ）的意思就是在某一个位置上不出现的概率， $\left ( 1-p_{d} \right )^{n-l+1}$ 表示的意思就是在某一行都不出现的概率，用一减去它则是出现的概率，再来个t次方便是t行出现的概率，最后和括号外面的相乘，得到最终的模体期望个数。

需要注意的是：E（l，d）越大，问题的求解越困难，当期望大于1的时候，称为挑战问题实例。

今天还用c++写了模体发现的穷举法，明天再贴吧，后面还要写PMSP算法。继续努力。

猜你喜欢

转载自blog.csdn.net/qq_27286563/article/details/81145885

暑期学习之生物序列模体发现算法研究基础（二）

暑期学习之生物序列模体发现算法研究基础（一）

暑期学习之植入（l,d)模体发现PMSPc++（四）

暑期学习之植入（l,d)模体发现穷举法c++（三）

论文学习——水文时间序列模体挖掘

基于图机器学习的微生物网络关系预测算法研究

【学习笔记】山东大学生物信息学-05 高通量测序技术介绍 + 06 统计基础与序列算法（原理）

基础算法技术研究之殇

2.6python基础之常用模(二)

模电基础学习

JGG | 中科院微生物研究所王军团队发现肠系膜淋巴系统可能为肠-肝轴第二通路...

Android学习研究(二)之BitmapShader

暑期算法心得---BFS(二）

生物信息之程序学习

多智能体强化学习入门（二）——基础算法（MiniMax-Q，NashQ，FFQ，WoLF-PHC）

算法竞赛备赛之经典基础算法训练提升，暑期集训营培训

STL之基础算法(二)

暑期Java学习笔记（二）

life science 研究领域之生物信息学

px4算法研究之基础知识整理

【深度学习数学基础之线性代数】研究使用链式法则进行反向传播的求导算法

SpringCloud全家桶学习之服务发现----Eureka（二）

生物信息-009-双序列局部比对及算法

机器学习之算法基础

生物信息基础学习笔记（2）

生物信息基础学习笔记（1）

C#学习篇之基础回顾（2）----- 结构体

模生物嗅觉的神经算法，能让电脑芯片识别气味

数据结构与算法基础（王卓）（35）：交换排序之快排【第二阶段：标准答案、初步发现问题】

生物信息学之序列比对

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)