使用应用程序在这里。
使采掘尽可能开放和可访问的数据意味着找到现有的数据和使用它,在分析和可视化。通常情况下,这些数据发表在一个PDF报告。
pdf文件并不是一个理想的出版格式的数据。数据表在pdf文档很难转化为机器可读的格式在一个电子表格应用程序中,使用像Microsoft Excel。复制和粘贴不会工作。
出于这个原因,在一个大型的数据收集项目,NRGI数据成员开发了一个应用程序,简化了过程,从一个PDF中提取一个表。这个工具都能在网上找到。
应用程序建立在开源软件横膈,识别表在PDF的重任和提取表格格式。不像横膈,整个应用程序可以通过web浏览器,不需要下载和安装。
应用程序设计的共同挑战表抓取,如需要容易比较值,以确保准确性。PDF的应用程序窗口中显示在一个完全可编辑电子表格中提取的数据,这一至关重要的一步是一如既往的方便。此外,用户可以一次刮多个页表在一个单一的点击,然后下载CSV文件。
这个应用程序是建立在开源技术和所有的代码可以在Github回购。建议可以或通过电子邮件(电子邮件保护)。使用应用程序在这里。
这个应用程序开发和发布你的支付——加拿大的帮助下,凯特稳索在一,和众多NRGI的同事。应用程序不可能没有开源的贡献横膈团队和rOpenSci团队。