首页猿问多文件读取循环并区分 .pdf 和...

多文件读取循环并区分 .pdf 和 .doc 文件

Java

摇曳的蔷薇 2023-07-28 09:46:42

我正在 Eclipse 中编写一个 Java 程序，除了显示每个简历的关键字之外，还可以扫描简历中的关键字并过滤其中最合适的简历。简历可以是doc/pdf格式。我已经成功实现了一个程序，可以分别读取pdf文件和doc文件（通过使用Apache的PDFBox和POI jar包并导入所需方法的库），显示关键字并根据找到的关键字数量显示简历强度。现在有两个问题陷入困境：(1) 我需要区分程序中的文件pdf和文件，这可以通过 if 语句轻松实现，但我很困惑如何编写代码来检测文件是否具有 .pdf 或 .doc 扩展名。doc（我打算构建一个应用程序来选择简历，但是程序必须决定是实现doc类型文件读取块还是pdf类型文件读取块）(2) 我打算运行该程序来获取简历列表，为此我需要一个循环，在其中我将为每个简历运行关键字扫描操作，但我想不出一种方法，因为即使文件的名称如“resume1”、“resume2”等，我们无法在文件位置中分配循环的可迭代变量，如：，因为'C:/Resumes_Folder/Resume[i]'这就是路径。任何帮助，将不胜感激！

查看完整描述

3 回答

一只甜甜圈

TA贡献1836条经验获得超5个赞

您可以使用 aFileFilter仅读取一种或另一种类型，然后做出相应的响应。它会给你一个List仅包含所需类型的文件。
第二个要求让我感到困惑。我认为通过创建一个类来封装您想要解析的数据和行为，您会得到很好的帮助Resume。编写一个工厂类，它接受InputStream并生成Resume包含您需要的数据的工厂类。

您犯了一个典型的错误：您将所有逻辑嵌入到主方法中。这将使测试您的代码变得更加困难。

所有的问题解决都是把大问题分解成小问题，解决小问题，然后组合起来最终解决大问题。

我建议您将这个问题分解为更小的类。例如，在您可以读取和解析单个 PDF 和 DOC 文件之前，不必担心循环遍历目录中的文件。

创建一个接口：

public interface ResumeParser {
    Resume parse(InputStream is) throws IOException;
}

为 PDF 和 Word Doc 实施不同的实现。

ResumeParser创建一个工厂以根据文件类型为您提供适当的：

public class ResumeParserFactory {

public ResumeParser create(String fileType) {

if (fileType.contains(".pdf") {

return new PdfResumeParser();

} else if (fileType.contains(".doc") {

return new WordResumeParser();

} else {

throw new IllegalArgumentException("Unknown document type: " + fileType);

}

请务必在进行时编写单元测试。您应该知道如何使用JUnit。

反对回复 2023-07-28

慕哥9229398

TA贡献1877条经验获得超6个赞

使用 a 的另一种替代方法FileFilter是使用 a DirectoryStream，因为Files::newDirectoryStream可以轻松指定相关的文件结尾：

try (DirectoryStream<Path> stream = Files.newDirectoryStream(dir, "*.{doc,pdf}")) {

for (Path entry: stream) {

// process files here

}

} catch (DirectoryIteratorException ex) {

// I/O error encounted during the iteration, the cause is an IOException

throw ex.getCause();

}

反对回复 2023-07-28

慕容708150

TA贡献1831条经验获得超4个赞

你可以做一些基本的事情，比如：

// Put the path to the folder containing all the resumes here

File f = new File("C:\\");

ArrayList<String> names = new ArrayList<>

(Arrays.asList(Objects.requireNonNull(f.list())));

for (String fileName : names) {

if (fileName.length() > 3) {

String type = fileName.substring(fileName.length() - 3);

if (type.equalsIgnoreCase("doc")) {

// doc file logic here

} else if (type.equalsIgnoreCase("pdf")) {

// pdf file logic here

}

反对回复 2023-07-28

3 回答
0 关注
121 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

多文件读取循环并区分 .pdf 和 .doc 文件

多文件读取循环并区分 .pdf 和 .doc 文件

3 回答

添加回答