ocr
-
百度开源3B模型Unlimited OCR:5天Star破万,刷新长文档解析纪录
百度最近开源了一个叫Unlimited OCR的模型,刚上线5天,GitHub Star就破万了。在AI开源项目里,这个速度相当惊人。 更关键的是,它解决了一个很实在的问题:长文档解析。 OCR不新鲜,但长文档OCR很头疼 OCR(光学字符识别)技术已经存在很多年了。你把一张照片里的文字提取出来,现在的技术基本都能做到。但问题是,现实场景中的文档往往很长——一本电子书、一份几十…