找軟件用軟件,就到華軍軟件園! 軟件發(fā)布

您好,如有軟件收錄需求,請(qǐng)將軟件打包,并附上軟件名稱(chēng)、軟件介紹、軟件相關(guān)截圖、軟件icon、軟著、營(yíng)業(yè)執(zhí)照(個(gè)人沒(méi)有營(yíng)業(yè)執(zhí)照請(qǐng)?zhí)峁?duì)應(yīng)的開(kāi)發(fā)者身份證正反面以及手持身份證本人照片),發(fā)送至郵箱 https://user.onlinedown.net/login

收起>>

發(fā)送至郵箱:news@onlinedown.net

收起>>

所在位置: 首頁(yè) — PC軟件 — MAC軟件 — 應(yīng)用程序  —  Apache Tika
Apache Tika

Apache Tika  0.7

二維碼
  • 軟件授權(quán): 免費(fèi)軟件
  • 軟件大?。? 1.64MB
  • 軟件評(píng)分:
  • 軟件類(lèi)型: 國(guó)外軟件
  • 更新時(shí)間: 2024-12-23
  • 應(yīng)用平臺(tái): Mac OS X
  • 軟件語(yǔ)言: 英文
  • 版      本: 0.7

下載服務(wù)協(xié)議見(jiàn)頁(yè)面底部

軟件介紹 相關(guān)專(zhuān)題 常見(jiàn)問(wèn)題 下載地址

基本簡(jiǎn)介
Apache Tika段首LOGO
    Tika是一個(gè)內(nèi)容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且為文本抽取工作提供了一個(gè)統(tǒng)一的界面。其次,Tika也提供了便利的擴(kuò)展API,用來(lái)豐富其對(duì)第三方文件格式的支持。

Tika提供了對(duì)如下文件格式的支持:

    * PDF - 通過(guò)Pdfbox
    * MS-* - 通過(guò)POI
    * HTML - 使用nekohtml將不規(guī)范的html整理成為xhtml
    * OpenOffice 格式 - Tika提供
    * Archive - zip, tar, gzip, bzip等
    * RTF - Tika提供
    * Java class - Class解析由ASM完成
    * Image - 只支持圖像的元數(shù)據(jù)抽取
    * XML

下載地址 分享軟件/應(yīng)用

部分文件為zip、rar等壓縮格式,請(qǐng)下載 360壓縮 進(jìn)行壓縮!

常見(jiàn)問(wèn)題