专业的信息化与通信融合产品选型平台及垂直门户
注册 登陆 设为首页 加入收藏
首页 企业新闻 招标信息 行业应用 厂商专区 活动 商城 中标信息

资讯
中心

新闻中心 人物观点
厂商专区 市场分析
行业
应用
政府机构 能源产业 金融机构
教育科研 医疗卫生 交通运输
应用
分类
统一协作 呼叫客服 IP语音 视频会议 智能管理 数据库
数字监控 信息安全 IP储存 移动应用 云计算 物联网

TOP

研究人员在DNA上存储计算机操作系统和短片
2019-01-04 15:44:30 来源:中国基因网 作者:【
关键词:存储
 
人类可能很快会产生比硬盘驱动器或磁带可以处理的数据更多的数据,这个问题让科学家转向大自然的信息存储DNA解决方案。在科学的一项新研究中,哥伦比亚大学和纽约基因组中心(NYGC)的一对研究人员表明,设计用于在手机上传输视频的算法可以通过将更多信息压缩到其四个基本核苷酸中来解锁DNA几乎完全的存储潜力。

  人类可能很快会产生比硬盘驱动器或磁带可以处理的数据更多的数据,这个问题让科学家转向大自然的信息存储DNA解决方案。在科学的一项新研究中,哥伦比亚大学和纽约基因组中心(NYGC)的一对研究人员表明,设计用于在手机上传输视频的算法可以通过将更多信息压缩到其四个基本核苷酸中来解锁DNA几乎完全的存储潜力。他们证明这项技术也非常可靠。DNA是一种理想的储存介质,因为它非常紧凑,如果保存在阴凉干燥的地方可以持续数十万年,最近从一个43万年前发现的人类祖先的骨骼中恢复DNA就证明了这一点。西班牙的一个洞穴。

  研究人员在DNA上存储计算机操作系统和短片
  研究报告的共同作者,哥伦比亚工程公司的哥伦比亚工程公司的计算机科学教授Yaniv Erlich说:“DNA不会随着时间的推移而像盒式录音带和CD那样降级,而且不会过时 - 如果确实如此,我们就会遇到更大的问题。”数据科学研究所,以及NYGC的核心成员。

  Erlich和他的同事,NYGC的副科学家Dina Zielinski选择了六个文件来编码或写入DNA:一个完整​​的计算机操作系统,一部1895年的法国电影,“在La Ciotat到达火车”,50美元的亚马逊礼物卡片,计算机病毒,先锋牌匾和信息理论家克劳德·香农1948年的一项研究。

  他们将文件压缩为主文件,然后将数据拆分为由1和0组成的短二进制代码串。使用称为喷泉码的擦除校正算法,他们将字符串随机打包成所谓的液滴,并将每个液滴中的1和0映射到DNA中的4个核苷酸碱基:A,G,C和T.算法删除了字母已知可以创建错误的组合,并为每个Droplet添加条形码以帮助以后重新组合文件。

  总之,他们生成了72,000条DNA链的数字列表,每条长度为200个碱基,并将其以文本形式发送给旧金山DNA合成创业公司Twist Bioscience,专门将数字数据转换为生物数据。两周后,他们收到一个装有DNA分子斑点的小瓶。

  为了检索他们的文件,他们使用现代测序技术来读取DNA链,然后使用软件将遗传密码翻译成二进制。研究报告称,他们在没有错误的情况下恢复了文件。(在这个简短的演示中,Erlich在虚拟机上打开他的归档操作系统并玩一个Minesweeper游戏来庆祝。)

  他们还证明,通过聚合酶链式反应(PCR)将DNA样本相乘,可以使用编码技术创建几乎无限数量的文件副本,这些副本,甚至副本的副本等都可以无错误地恢复。

  最后,研究人员表明,他们的编码策略在一克DNA上包含215PB的数据 - 比哈佛大学的先驱研究人员George Church和欧洲生物信息学研究所的Nick Goldman和Ewan Birney所发表的方法多100倍。“我们相信这是有史以来密度最高的数据存储设备,”Erlich说。

  理论上,DNA数据存储的容量限于每个核苷酸的两个二进制数字,但DNA本身的生物学限制以及包含冗余信息以重新组装和读取片段的需要随后将其容量降低至每个核苷酸碱基1.8个二进制数字。

  该团队的见解是应用喷泉代码,这是Erlich从研究生院学到的一种技术,使阅读和写作过程更加高效。利用他们的DNA Fountain技术,Erlich和Zielinski在每个碱基核苷酸中平均包含1.6位。这比以前发布的方法至少多60%的数据,接近1.8位的限制。

  成本仍然是一个障碍。研究人员花了7,000美元来合成他们用于存档2兆字节数据的DNA,另外花费2000美元来阅读它。虽然DNA测序的价格呈指数下降,但对于DNA合成的需求可能并不相同,加州大学洛杉矶分校的生物化学教授斯科索里说,他没有参与这项研究。“投资者可能不愿意冒很多钱来降低成本,”他说。

  但是,如果生成质量较低的分子,DNA合成的价格可以大大降低,并且像DNA Fountain这样的编码策略被用来修复分子错误,Erlich说。“我们可以在计算机上做更多的繁重工作,以减轻时间密集型分子编码的负担,”他说。

      

责任编辑:admin
免责声明:以上内容转载互联网平台或企业单位自行提供,对内容的真实性、准确性和合法性不负责,Voipchina网对此不承担任何法律责任。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部

上一篇嵌入式编程:平台大小端存储差异..
下一篇备份不重要?信息储存还得靠云服务

热门文章

图片主题

最新文章

相关文章

广告位

Copyright@2003-2009 网络通信中国(原VoIP中国) 版权所有
联系方式:503927495@qq.com
  京ICP备05067673号-1 京公网安1101111101259

《合作通告》

本站因快速发展需要,有共赢合作、战略创投意向的个人或机构,请联系咨询:
(电话)010-69397252、13911442656(v)
(邮箱)503927495@qq.com
我知道了