开源科研图表数据提取工具SciDataExtractor
在科研工作中,处理图表数据是一项常见任务。为了帮助科研人员更高效地从图表中提取数据,开发者创建了一个开源工具——SciDataExtractor。这个工具能够将静态图表图片转换为可编辑的Excel数据,极大地简化了数据处理流程。
SciDataExtractor基于FastAPI和React开发,结合了计算机视觉和AI技术,能够精准地识别图表中的曲线数据。它支持交互式坐标校准和HSV颜色提取,并具备AI数据清洗与断点修复功能,有效去除噪点并补全曲线,从而辅助科研人员进行高效的数据分析。
工具的主要功能是利用OpenCV(HSV颜色空间)进行分割,提取图片中特定颜色的曲线数据,然后描点,最终输出到Excel文件中。此外,SciDataExtractor还加入了AI数据清洗、修复和平滑功能,尽管在复杂情况下效果可能不如手工绘制,但对于大多数常规图表,它已经足够好用。
工具的一个亮点是支持手工绘制,如果自动识别效果不佳,用户可以手动描点并调整平滑度,以获得更准确的数据。根据测试,设置50的颜色容差通常可以大致勾勒出曲线轮廓,如果需要更高的精度,可以手动调整几个关键点。
SciDataExtractor还可以在Origin中复现,工具能够识别特定颜色的RGB,用户可以在Origin中直接设置相同的颜色进行数据处理。这个工具对于需要进行大量图表数据提取的科研人员来说,无疑是一个非常有用的资源。SciDataExtractor的开源地址为:yyy-OPS/SciDataExtractor,欢迎科研人员使用和贡献。
评论已关闭