生物信息学软件(生物信息学常用的软件有哪些)
本文目录
生物信息学常用的软件有哪些
NCBI(www.ncbi.nlm.nih.gov)-GenBank数据库数据库相似性搜索——核酸序列与核酸数据库比较(BLASTN) 蛋白质序列与数据库中蛋白质序列比较(BLASTP) 两序列比对(Align two sequences)DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)分析实验序列外显子部分——GENSCAN(http://genes.mit.edu/GENSCAN.html)分析实验序列的可能酶切位点——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php) 注: Custom digest -- view gel限制性内切酶数据库——REBASE(http://rebase.neb.com/rebase/rebase.html)设计引物扩增实验序列——Genefisher Primer 3蛋白质序列分析及结构预测: 1.预测蛋白质的分子量及等电点:ExPASy(Compute pI/Mw) 2.分析蛋白质的基本物理化学性质:ExPASy(ProtParam) 3.分析蛋白质的亲水性和疏水性:ExPASy(ProtScale) 4.分析蛋白质在各种蛋白酶和各种化学试剂处理后的内切产物:ExPASy(PeptideMass) 5.分析蛋白质的信号肽:ExPASy(SignalP) 6.预测蛋白质的二级结构:ExPASy(Jpred 3)多物种分子系统发育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W人脂联素蛋白质序列:NP_004788人类胰岛素生长因子IB前体:P05019
生物信息学一些基本的常用软件有哪些
序列拼接软件:velvet,SOAPdenvoo,SSAKE,ABySS,Trinity 等短序列比对软件: bwa,bowtie,tophat,SOAPAligner 等局部比对软件:Blast,blat,CorssMatch 等多序列全局比对软件:Muscle,clustalw 等基因预测软件:Glimmer,GeneMark,Augustus,FgeneSH,SNAP,GeneScan,EuGENE,Glean等重复序列预测软件:RepeatMasker,TRF等聚类软件:MCL,hcluster_sg等统计软件:pLINK,TASSEL,R,SPSS等...
列举常用的生物信息学数据库及序列对比常用软件及特点
一般来说所用的分析工具有在线跟下载的 下面简要列举一些常用在线软件的使用 1、使用VecScreen工具,分析下列未知序列,输出序列长度、载体序列的区域、可能使用的克隆载体都有哪些。一、步骤:打开google 首页,搜索VecScreen,进入VecScreen首页,复制序列,运行,View report。二、结果:输出序列长度918bp,载体序列的区域456bp——854bp.克隆载体:M13mp18 phage,pGEM-13Zf(+),pBR322,pRKW2。2、使用相应工具,分析下列未知序列的重复序列情况,输出重复序列的区域、包含的所有重复序列的类型、重复序列的总长度及Masked Sequence。一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的。进入google首页,搜索RepeatMasker,进入RepeatMasker主页,进入RepeatMasking,复制序列,DNA source选择human,运行!点击超链接,在结果中选择Annotation File :RM2sequpload_1287631711.out.html3、使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,输出CpG岛的长度、区域、GC数量、所占的百分比及Obs/Exp值。一、步骤:进入google首页,搜索CpGPlot,进入CpGPlot主页,program中选择cpgreport复制序列,运行!二、结果: CpG岛的长度:385bp区域:48——432;GC数量:Sum C+G=297,百分数=77.14Obs/Exp:1.014、预测下面序列的启动子,输出可能的启动子序列及相应的位置。一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的进入google首页,搜索Neural Network Promoter Prediction,进入主页,复制序列,选择eukaryote,运行!二、结果: 位置:711—761 ,1388—1438,1755—1805;5、运用Splice Site Prediction工具分析下面序列,分别输出内含子-外显子剪接位点给体和受体的区域及剪接处位置的碱基。一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的进入google首页,搜索Splice Site Prediction,进入主页,复制序列。Organism选择Human or other。其他默认,运行!二、结果:供体: 受体:6、对下面序列进行六框翻译,利用GENESCAN综合分析(首先确定给定序列的物种来源)哪个ORF是正确的,输出六框翻译(抓图)和GENESCAN结果(包括predicted genes/exons 和 predicted peptide sequence(s) 两个部分)。一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是Zea的进入google首页;搜索NCBI,进入主页,选择all resources(A~Z),选择O,选择ORF finder。复制序列,默认,运行!二、结果:ORF图三、步骤:进入google首页,搜索GENESCAN,进入主页,Organism:Maize, ,其他默认,运行!四、结果:G7、进入REBASE限制性内切酶数据库,输出AluI、MboI、EcoI三种内酶的Recognition Sequence和Type。一、步骤:进入google首页,google in English,搜索REBASE,进入主页, 分别输入AluI、MboI、EcoI,运行!在MboI中选择第一个,EcoI选择第二个。二、结果:ENSCAN图8、使用引物设计工具,针对下列未知序列设计一对引物,要求引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃。请写出选择的一对引物(Forward Primer and Reverse Primer)、及相应的GC含量、引物的位点、Tm值和产物长度。一、步骤:进入google首页,搜索genefisher,进入主页,复制fasta格式,chechk input, sunmit, ; ;设置一下引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃; 。二、结果: GC含量: 引物的位点: Tm值: 产物长度:。 9、将下面的序列用NEBcutter 2.0工具分析,用产生平末端及有四个酶切位点的酶进行酶切,并用抓图提交胶图(view gel),要求1.4% agarose和Marker为100bp DNA Ladder。一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST,得知是linear。进入google首页,搜索NEBcutter 2.0,进入主页,选择linear,运行!选择custom digest, ,把“1”改为“4”,选择平末端,后digest。View gel。选择1.4% agarose和Marker为100bp。二、结果:然后就是蛋白质的了一般都在expasy里swiss-prot 适用于检索的 compute pi/mw 求理论分子量 分子量 protparam物理化学性质 protscale亲水性疏水性 peptidemass分析蛋白酶和化学试剂处理后的内切产物 NCBI(www.ncbi.nlm.nih.gov)-GenBank数据库数据库相似性搜索——核酸序列与核酸数据库比较(BLASTN) 蛋白质序列与数据库中蛋白质序列比较(BLASTP) 两序列比对(Align two sequences)DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)分析实验序列外显子部分——GENSCAN(http://genes.mit.edu/GENSCAN.html)分析实验序列的可能酶切位点——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php) 注: Custom digest -- view gel限制性内切酶数据库——REBASE(http://rebase.neb.com/rebase/rebase.html)设计引物扩增实验序列——Genefisher Primer 3蛋白质序列分析及结构预测: 1.预测蛋白质的分子量及等电点:ExPASy(Compute pI/Mw) 2.分析蛋白质的基本物理化学性质:ExPASy(ProtParam) 3.分析蛋白质的亲水性和疏水性:ExPASy(ProtScale) 4.分析蛋白质在各种蛋白酶和各种化学试剂处理后的内切产物:ExPASy(PeptideMass) 5.分析蛋白质的信号肽:ExPASy(SignalP) 6.预测蛋白质的二级结构:ExPASy(Jpred 3)多物种分子系统发育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W人脂联素蛋白质序列:NP_004788人类胰岛素生长因子IB前体:P05019
生物信息学笔记-术语篇
它是一种度量两个变量间相关程度的方法。它是一个介于 1 和 -1 之间的值,其中,1 表示变量完全正相关, 0 表示无关,-1 表示完全负相关。 r值就是皮尔逊相关系数的大小,代表了相关的强度,即两个变量共变性的程度,取值范围为(-1,1)。p值是显著性,与皮尔逊相关显著性检验有关,P《0.05时表示相关显著,即在当前的样本下可以明显的观察到两变量的相关,两个变量的相关有统计学意义。 能提供有关数据位置和分散情况的关键信息,尤其在比较不同的母体数据时更可表现其差异。如上图所示,标示了图中每条线表示的含义,其中应用到了分位值(数)的概念。随访研究,如对 某人群进行跟踪,直至出现一个特殊事件或终点,如死亡、癌症复发等,对所有研究对象从某特定时间点开始追踪,记录出现特殊事件的时间。通常,当所有研究对 象出现该事件时研究才结束,但也有些研究对象可能失访,或者研究提前结束,这样就有一些对象的结局未知,对这些对象记录跟踪的时间(截尾数据)。 假设检验 是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另一个依据。P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P 《 0.05 为显著, P《0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。实际上,P值不能赋予数据任何重要性,只能说明某事件发生的机率。 主要包含六个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上 四分位数 Q3, 中位数 ,下四分位数Q1,下边缘,还有一个 异常值 。 是表示这两组之间的生存率是否有差异。因为一般生存分析研究的都是一个实验组的治疗方法之类的, 一个对照组的传统方法之类。通过生存分析对比,可以发现两组生存率之间是否存在差异,继而说明两种实验处理是否有差异,或者哪种处理更有效 是整体比较,比如你的生存时间是5年的,那自然是比较整体5年下来的生存率,如果你的生存时间是10年的跟踪数据,那自然是比较整体10年下来的生存率。生存分析比较的生存率,本来就是一个整体一段时间持续下来的生存率,而不是单个时间点的生存率 数据标准化是指:数值减去均值,再除以标准差;所谓中心化, 是指变量减去它的均值.又称蛋白质印迹(Western blotting),是一种借助特异性抗体鉴定抗原的有效方法。该方法是在凝胶电泳和固相免疫测定技术基础上发展起来的一种新的免疫生化技术,既具有凝胶电泳的高分辨率又具备固相免疫测定的高特异性和高灵敏性,可检测1-5ng的中等大小蛋白。其优点是方法简便、标本可长期保存、结果便于比较,故被广泛应用于分子生物学等领域,成为一种常用的一种研究方法。保守性一般是在进化理论中应用较多,“保守性好”指的是发生突变的几率低。以蛋白为例,一般用于进化或物种亲缘关系分析的蛋白都含有可变部分——非保守区,和稳定部分——保守区。顺式作用元件(cis-acting element)是指DNA分子上对基因表达有调节活性的特定核苷酸序列。顺式作用元件的活性只影响同一DNA分子上的基因。这种DNA序列多位于基因上游或内含子中。 真核基因的顺式作用元件按其功能可以分为:启动子、增强子和静止子。 启动子的结构和功能 启动子是转录因子和RNA聚合酶的结合位点,位于受其调控的基因上游,邻近基因转录起始点,是基因的一部分。 增强子的结构和功能 增强子(enhancer),又称强化子(transcriptional enhancer),是一种远端调控元件,至少距转录起始点上游100bp以上,通常位于-700~-1000处,所以又称为上游激活序列(upstream activator sequence, UAS)。 增强子也要通过与特定的蛋白质因子(转录因子)结合而实现其对转录的增强作用。 静止子 是一种类似增强子但起负调控作用的顺式作用元件。有人称为沉默基因。静止子与相应的反式作用因子结合后,可以使正调控系统失去作用。 不论是启动子还是增强子序列,他们的转录调节功能都是通过与特定的DNA结合蛋白的相互作用而实现的。 真核生物的RNA聚合酶与原核生物的RNA聚合酶不同,它本身不能启动转录,纯化了的真核生物RNA聚合酶在体外是不能启动转录的。因此必须事先有一套转录因子装配到启动子上,RNA聚合酶才能启动转录。 这些转录因子一般并不是RNA聚合酶的组成成分。 能直接或间接识别各种顺式调控元件并与之结合从而调控基因转录效率的各种蛋白质分子称为反式作用因子 (trans-acting factor)。 能激活真核生物基因转录的蛋白质称为转录因子(transcription factor, TF)。转录因子是参与正调控的反式作用因子,是转录起始过程中RNA聚合酶所需要的辅助因子。 是根据抗原抗体的特异性结合检测复杂样品中的某种蛋白的方法。 将混合抗原样品在凝胶板上进行单向或双向电泳分离, 然后取 固定化 基质膜与凝胶相贴。在印迹纸的自然吸附力、 电场力 或其它外力作用下, 使凝胶中的单一抗原组份转移到印迹纸上, 并且固相化。最后应用免疫覆盖液技术如免疫同位素探针或免疫酶探针等, 对抗原固定化 基质 膜进行检测和分析。有时称为短干扰RNA(short interfering RNA)或沉默RNA(silencing RNA),是一个长20到25个 核苷酸 的双股RNA,在生物学上有许多不同的用途。CpG表示核苷酸对,其中G在DNA链中紧随C后。CpG对很少出现在人类基因中。然而,在许多基因的 启动子 (promotor)或 转录起始位点 (transcription start site,TSS)区域周围, 甲基化 经常被抑制。这些区域包含浓度相对较高的CpG对,与染色体一起称作 CpG岛 ,其长度通常在几百到几千核苷酸的长度内变化。CpG双核苷酸在人类基因组中的分布很不均一,而在基因组的某些区段,CpG保持或高于正常概率,这些区段被称作CpG岛,在哺乳动物基因组中的1~2kb的DNA片段,它富含非甲基化的CpG双倍体。所谓阴性和阳性指的是细胞生存下来的条件。阳性选择指的是只有反应的细胞才能生存,否则凋亡。阴性选择指的是只有不反应的细胞才能生存,否则凋亡。 对于B细胞来说 阴性选择指的是只有在骨髓发育中不予自身抗原反应的B细胞才能生存;阳性选择指的是在外周在体细胞高频突变的过程中能高亲和力识别T细胞提呈的B细胞才能增殖。B细胞是先阴选后阳选 对于T细胞来说 阳性选择指的是只有在胸腺皮质发育中识别MHC分子的T细胞才能生存;阴性选择指的是只有在胸腺髓质发育中不予自身抗原反应的T细胞才能生存;T细胞是先阳选后阴选一般指基因组中由短的重复单元(一般为1~6个碱基)组成的DNA串联重复序列。 微卫星DNA符合孟德尔遗传模式,共显性表达,广泛分布于真核生物的基因组中,包括编码区和非编码区.研究表明,可能是DNA复制过程中的“链滑”(strand slippage)现象造成微卫星DNA多态性信息容量(polymorphic information content, PIC)较高. 由于微卫星具有数量多、在基因组内分布均匀、多态性信息丰富、易于检测等优点被作为优良的遗传标记(genetic marker)而得到广泛应用。 根据重复单元的构成与分布,微卫星DNA序列被分为3种类型:单一型(pure),复合型(compound)和间断型(interrupted), 例如: 单一型:ATATATATATATATATATATATAT 复合型: ATATATCACACACACACACAC 间断型: ATATATCA ATATATCA ATATATA 某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。由遗传重组测验结果推算出来的、在一条染色体上可以发生的突变座位的直线排列(基因位点的排列)图。遗传图谱即遗传连锁图谱,是基因组研究中的一个重要组成部分,它是指基因组中基因以及专一的多态性标记之间相对位置的图谱。即通过两点测验和三点测验对统计的各种带型个体数进行连锁分析计算,建立连锁群。也可从第二个标记开始,测验与前一个标记是否协同分离。根据分离资料,用最大似然法估计不同标记位点间的重组率数值并转换成遗传距离,连锁的遗传标记间距离,一般用cM表示,IcM为同源染色体配对期望交换值1%的染色体长度。随着计算机技术的发展,目前已有多个构建遗传图谱的软件,研究者用的较多的软件主要有MapMaker及 JoinMap 3.0 。在某些情况下,待检验样本中不含待测物质或者含有但是浓度很低,为了证明自己建立的方法能对样本中待测物质进行有效的检测,可在待检样本中加入一定量的待测物质(外标)来进行该方法检测能力的验证。有时,这种加入外标的物质,也可用作为阳性对照。 In genetics, a mosaic, or mosaicism describes the presence of two or more populations of cells with different genotypes in one individual, who has developed from a single fertilized egg.Mosaicism has been reported to be present in as high as 70% of cleavage stage embryos and 90% of blastocyst-stage embryos derived from in vitro fertilization. WGA是一组对全部基因组序列进行 非选择性扩增的技术,其目的是在没有序列倾向性的前提下大幅度增加 DNA 的总量。其中最具代表性方法是 DOP-PCR 和 PEP-PCR。 DOP-PCR 和 PEP-PCR 的基本原理都是通过其随机引物与基因组 DNA 多处退火从而使大部分基因组序列得到扩增。DOP-PCR 的引物是由其 3′和 5′端的特异核苷酸序列和中间的 6 个核苷酸构成的随机引物组成。PEP-PCR 的引物是由15 个随机核苷酸组成的完全随 机引物。
更多文章:
联想lenovo product(联想 Lenovo Product)
2023年5月16日 09:00
i3 330m性能相当于(笔记本的CPU酷睿i3 330m的性能相当台式机的哪个CPU)
2024年4月19日 05:40
笔记本开机后一直进不了系统(电脑开机后进不了系统怎么办 电脑开机后进不了系统如何办)
2023年8月20日 03:20
七彩虹的整机能不能买(台式机七彩虹的组装台式机值得买吗,同等配置的情况下自己组装的话会比7499少多少钱呀电脑的配置)
2024年5月22日 12:45
联想x200s蓝牙驱动(THINKPAD X200的蓝牙怎么打不开了)
2024年5月27日 00:46
联想小新笔记本超薄(lenovo/联想 小新air i5-6200u 13怎么样)
2024年8月21日 00:40
联想thinkpad 10(联想Thinkpad,win10系统,联接wifi后弹出找不到应用程序,怎么解决)
2024年9月20日 01:05
i945gm主板支持的cpu(笔记本i945GM的板子能支持最大频率多少的内存)
2024年7月11日 07:27
gtx950能玩绝地求生吗(gtx950独显2g可以吃鸡吗)
2024年11月4日 22:40
海尔集团公司简介 海尔集团的基本介绍?海尔笔记本F2的图标是什么意思啊
2024年6月17日 17:17
联想一体机怎么连接蓝牙耳机(一体机电脑上有蓝牙功能,请问能不能连接无线耳机)
2024年7月1日 07:55