admin 管理员组文章数量: 1086019
2024年3月19日发(作者:数的多音字组词和意思)
JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法
示例
2012-06-29 17:13:08| 分类: JAVA | 标签: |字号大中小 订阅
以下是Java对几种文本文件内容读取代码。其中,OFFICE文档(WORD,EXCEL)使用了POI控件,PDF使用了PDFBOX
控件。
查看相关控件的下载地址和配置方法。
转自:/allan811112/blog/item/
WORD
Java代码
package textReader;
import .*;
import tractor;
public class WordReader {
public WordReader(){
}
/**
* @param filePath 文件路径
* @return 读出的Word的内容
*/
public String getTextFromWord(String filePath){
String result = null;
File file = new File(filePath);
try{
FileInputStream fis = new FileInputStream(file);
WordExtractor wordExtractor = new WordExtractor(fis);
result = t();
}catch(FileNotFoundException e){
tackTrace();
}catch(IOException e){
tackTrace();
};
return result;
}
}
EXCEL
Java代码
package textReader;
import rkbook;
import eet;
import w;
import ll;
import putStream;
import tFoundException;
import ption;
public class ExcelReader {
@SuppressWarnings("deprecation")
/**
* @param filePath 文件路径
* @return 读出的Excel的内容
*/
public String getTextFromExcel(String filePath) {
StringBuffer buff = new StringBuffer();
try {
//创建对Excel工作簿文件的引用
HSSFWorkbook wb = new HSSFWorkbook(new FileInputStream(filePath));
//创建对工作表的引用。?????????
for (int numSheets = 0; numSheets < berOfSheets(); numSheets++) {
if (null != etAt(numSheets)) {
HSSFSheet aSheet = etAt(numSheets);//获得一个sheet
for (int rowNumOfSheet = 0; rowNumOfSheet <= tRowNum(); rowNumOfSheet++) {
if (null != (rowNumOfSheet)) {
HSSFRow aRow = (rowNumOfSheet); //获得一个行
for (int cellNumOfRow = 0; cellNumOfRow <= tCellNum(); cellNumOfRow++) {
if (null != l(cellNumOfRow)) {
HSSFCell aCell = l(cellNumOfRow);//获得列值
switch(lType()){
case _TYPE_FORMULA:
break;??
case _TYPE_NUMERIC:
(ericCellValue()).append('t');break;
case _TYPE_STRING:
(ingCellValue()).append('t');break;?????????????????????????????????????????????????????
?????????
}????????????????????????????
}?????????????????????????????????????????????????????????????????????????????????
}
('n');
}
}???????????????????????????????????????
}????????????
}
} catch (FileNotFoundException e) {
tackTrace();
} catch (IOException e) {
版权声明:本文标题:JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/b/1710815941a574542.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论