当前位置: 首页 > news >正文

学校网站制作推荐什么网站可以做实验室

学校网站制作推荐,什么网站可以做实验室,网络推广经典和常用的方法,网站运营网站建设今天给大家推荐一款文本处理工具#xff0c;可以Extract、Redact、Summarize、Refine、Translate、Interrogate#xff0c;这个工具就是文档转换框架doctran。 欢迎关注公众号 doctran基于OpenAI的GPT模型和开源的NLP库来剖析文本数据。该工具也可以在LangChain框架document…今天给大家推荐一款文本处理工具可以Extract、Redact、Summarize、Refine、Translate、Interrogate这个工具就是文档转换框架doctran。 欢迎关注公众号 doctran基于OpenAI的GPT模型和开源的NLP库来剖析文本数据。该工具也可以在LangChain框架document_transformers模块内使用。本质上是对LLM和NLP库的封装 Github: https://github.com/psychic-api/doctran Example: https://github.com/psychic-api/doctran/blob/main/examples.ipynb 1. 安装 pip install doctran2. 使用 初始化设置 from doctran import DoctranOPENAI_API_KEY OPENAI_MODEL doctran Doctran(openai_api_keyOPENAI_API_KEYopenai_modelOPENAI_MODEL) document doctran.parse(contentyour_content_as_string)注修改openai_api_base、使用其他LLM等可在源码中修改即可。 Extract 针对任何有效的JSON模式使用OpenAI的函数调用从文档中提取结构化数据。 from doctran import ExtractPropertyproperties ExtractProperty(namemillenial_or_boomer, descriptionA prediction of whether this document was written by a millenial or boomer,typestring,enum[millenial, boomer],requiredTrue ) document await document.extract(propertiesproperties).execute()Redact 使用spaCy模型从文档中删除姓名、电子邮件、电话号码和其他敏感信息。在本地运行以避免将敏感数据发送到第三方API。 document await document.redact(entities[PERSON, EMAIL_ADDRESS, PHONE_NUMBER, US_SSN]).execute()Summarize 总结文档中的信息。可以传递token_limit以配置摘要的大小然而OpenAI可能不会遵循此限制。 document await document.summarize().execute()Refine 除非与特定主题相关否则从文档中删除所有信息。 document await document.refine(topics[marketing, meetings]).execute()Translate 将文本翻译成另一种语言。 document await document.translate(languagespanish).execute()Interrogate 将文档中的信息转换成问答格式。最终用户的查询通常以问题的形式提出因此将信息转换为问题并从这些问题创建索引通常在使用向量数据库进行上下文检索时能够产生更好的结果。 document await document.interrogate().execute()Interrogate可以帮助构造大模型有监督微调阶段的问答对。 3. 总结 doctran使用简单可以用于日常工作中的数据处理。
http://icebutterfly214.com/news/22984/

相关文章:

  • 2025-11-07 早报新闻
  • R语言实现多组样本两两t检验的完整教程
  • SDOI 2024游记兼退役游记
  • NOIP 模拟赛 3 比赛总结
  • 2025年TWS耳机磁铁厂家权威推荐榜单:手机磁铁/钕铁硼磁铁/稀土磁铁源头厂家精选
  • 2025 年 11 月深圳店铺装修公司推荐排行榜,餐饮店铺装修,商场店铺装修,连锁店铺装修,零售店铺装修设计公司推荐
  • 护手仪ESD整改-ASIM阿赛姆
  • 2025年市面上成都小程序机构top10推荐:杰诚智享领跑行业
  • 气氛
  • 2025年热门成人自考机构推荐
  • 小 E 的传奇一生
  • 2025 年 11 月全自动加袋机厂家推荐排行榜,FFS/25公斤/吨袋/吨包全自动上袋机,肥料/铜精粉全自动吨袋上袋机,无锡江苏全自动吨包上袋机公司推荐
  • 2025 年 11 月包装称厂家推荐排行榜,全自动/定量/FFS重膜/高速/锂电/零排放/螺旋/吨袋包装称,铜精粉/肥料吨包包装称公司精选
  • 2025 年 11 月潜水泵厂家推荐排行榜,新型潜水泵,节能潜水泵,低噪声潜水泵,超低压潜水泵,防爆潜水泵,高压潜水泵,防腐潜水泵,SF潜水泵,SFB潜水泵,WF屋顶潜水泵公司推荐
  • git 添加大文件
  • OIFC 2025.11.7 模拟赛总结
  • 2025年背封湿巾包装机生产厂家权威推荐榜单:棉片湿巾包装机/航空湿巾包装机/一次性湿巾包装源头厂家精选
  • 2025 年防静电地板源头厂家最新推荐榜单:权威品牌实力展现及选购指南生产防静电地板/防静电活动地板/抗静电地板公司推荐
  • 2025 年 TM 芯片代理商最新推荐榜单:聚焦规模化采购与敏捷物流能力,前五权威测评解析广东 TM 芯片 / 深圳 TM 芯片推荐
  • P4401 [IOI 2007] Miners 矿工配餐 题解
  • 第一周--2:Ubuntu24.04虚拟机环境准备与安装
  • 安装btop
  • 深入解析:OpenCV(二):加载图片
  • 2025 年雷达流量计厂家最新推荐榜:综合实力、技术优势与口碑测评精选明渠雷达流量计/多普勒雷达流速流量计公司推荐
  • 2025年防爆正压柜订制厂家权威推荐榜单:防爆配电柜/防爆配电箱/防爆检测箱源头厂家精选
  • 2025年气流粉碎机订制厂家权威推荐榜单:气流粉碎分级机/气流超微粉碎机/气流磨粉机源头厂家精选
  • 动态规划 - 背包困难
  • Round 21 解题报告
  • 基于MATLAB生成雷达脉冲信号
  • Python 必背内置函数