admin 管理员组

文章数量: 1086019


2024年3月19日发(作者:数的多音字组词和意思)

JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法

示例

2012-06-29 17:13:08| 分类: JAVA | 标签: |字号大中小 订阅

以下是Java对几种文本文件内容读取代码。其中,OFFICE文档(WORD,EXCEL)使用了POI控件,PDF使用了PDFBOX

控件。

查看相关控件的下载地址和配置方法。

转自:/allan811112/blog/item/

WORD

Java代码

package textReader;

import .*;

import tractor;

public class WordReader {

public WordReader(){

}

/**

* @param filePath 文件路径

* @return 读出的Word的内容

*/

public String getTextFromWord(String filePath){

String result = null;

File file = new File(filePath);

try{

FileInputStream fis = new FileInputStream(file);

WordExtractor wordExtractor = new WordExtractor(fis);

result = t();

}catch(FileNotFoundException e){

tackTrace();

}catch(IOException e){

tackTrace();

};

return result;

}

}

EXCEL

Java代码

package textReader;

import rkbook;

import eet;

import w;

import ll;

import putStream;

import tFoundException;

import ption;

public class ExcelReader {

@SuppressWarnings("deprecation")

/**

* @param filePath 文件路径

* @return 读出的Excel的内容

*/

public String getTextFromExcel(String filePath) {

StringBuffer buff = new StringBuffer();

try {

//创建对Excel工作簿文件的引用

HSSFWorkbook wb = new HSSFWorkbook(new FileInputStream(filePath));

//创建对工作表的引用。?????????

for (int numSheets = 0; numSheets < berOfSheets(); numSheets++) {

if (null != etAt(numSheets)) {

HSSFSheet aSheet = etAt(numSheets);//获得一个sheet

for (int rowNumOfSheet = 0; rowNumOfSheet <= tRowNum(); rowNumOfSheet++) {

if (null != (rowNumOfSheet)) {

HSSFRow aRow = (rowNumOfSheet); //获得一个行

for (int cellNumOfRow = 0; cellNumOfRow <= tCellNum(); cellNumOfRow++) {

if (null != l(cellNumOfRow)) {

HSSFCell aCell = l(cellNumOfRow);//获得列值

switch(lType()){

case _TYPE_FORMULA:

break;??

case _TYPE_NUMERIC:

(ericCellValue()).append('t');break;

case _TYPE_STRING:

(ingCellValue()).append('t');break;?????????????????????????????????????????????????????

?????????

}????????????????????????????

}?????????????????????????????????????????????????????????????????????????????????

}

('n');

}

}???????????????????????????????????????

}????????????

}

} catch (FileNotFoundException e) {

tackTrace();

} catch (IOException e) {


本文标签: 内容 文件 多音字 字号