【教程】使用Tablify导出多页面网页表格和分批动态加载数据的网页表格
当页面中的表格结构比较复杂,表格数据需要分批加载呈现在网页,需要点击按钮进行翻页,以及需要下拉或点击按钮加载完整表格数据时,推荐使用 Tablify 的表格获取向导功能。
提醒:安装完Tablify后,如果没有刷新目标表格所在的网页,请先刷新。刷新并等待网页加载完成,再打开Tablify。
1打开 Tablify 并进入向导入口
在目标网页中打开 Tablify 侧边栏,点击“启动表格获取向导”入口,进入向导模式。
2完整选择待导出的网页表格
按照向导提示在网页上分别选中表格的表头、表体。选中表头后,需点击确认按钮,才能继续选择表体数据行。
注意:要完整选中表格,避免只框选局部内容。可以结合网页的高亮区域、侧边栏中已选中的行列数统计,确认是否完整选中表格在当前页面的内容。
注意,只需要选中目标表格在当前页面显示的内容。不必先通过翻页、下拉或点击加载等方式去加载该表格的更多数据。
- 表头:就是表格的标题行,通常包含列名。
- 表体:就是表格除标题之外的数据行,通常包含实际数据。
3预览识别结果并微调
查看Tablify表格获取向导给出的表头(标题)、表体的识别预览。
若识别出多余的表头列名,可去除对应列名的勾选;若缺失表头,可通过“添加列名”功能在合适的位置添加表头列名,同时确保与网页中表格的表头顺序与数量一致。
另外,需要调整识别结果中表体数据列的顺序,确保与网页中表格的列顺序一致,与上面的表头列名也能一一正确对应。
4获取完整表格数据
根据网页表格数据加载方式,以及你的需求,选择合适的方式提取表格数据。
其中你可以设置提取方式的参数:比如获取几页、页面加载间隔时长(间隔太短容易导致数据重复或缺失)等。
- 启用翻页获取:适用于分页类型的表格。这类表格往往需要点击数字页码、"下一页"、"Next"等类似按钮,才能加载更多数据。
- 启用滚动加载:适用于下拉页面加载数据的表格。这类表格需要下拉滚动页面,才能加载更多数据。
- 启用点击加载:适用于点击按钮加载更多数据的表格。这类表格需要点击"加载更多"、"更多"、"More"等类似按钮,才能加载更多数据。
- 只获取当前页面数据:适用于表格数据在当前页面完整展示,不需要分页加载或滚动加载;或者你只需要获取当前页面数据的情况。
5复制或导出提取网页表格数据
获取数据后,可以选择将已提取的网页表格数据直接复制或导出为Excel、WPS、CSV、Word、图片、纯文本、Markdown文本等格式文件。
使用建议
对于分页加载、滚动加载或动态更新的数据页面,建议在网页打开完成后再启动向导,以获得更稳定的识别结果。
部分页面结构复杂,需要耐心等待识别结果。
如果有问题或建议,先看“常见问题解答”页面,或联系网站邮箱tablify@163.com。