Ein kostenloser Software-CV/Resumé-Parser

Ich suche eine Softwarelösung zum Extrahieren von Daten aus Lebensläufen in verschiedenen Formaten (PDF, Microsoft Word usw.).

Was ich brauche ist:

  1. Extrahieren von Name, Nachname, E-Mail, Telefonnummern, segmentierter Postanschrift (Straße, Postleitzahl usw.) in eine verwertbare strukturierte Ausgabe
  2. eine kostenlose Softwarelösung
  3. Extrahieren anderer typischer Lebenslaufeinträge (vorherige Berufsbezeichnung usw.)
  4. eine Lösung, die die vorherigen Ergebnisse direkt in OpenERP integriert (beachten Sie, dass OpenERP jetzt als odoo bekannt ist ).

Idealerweise würde es sich nahtlos in OpenERP integrieren , aber jede Lösung, die eine Schlüssel/Wert-Ausgabe liefern würde, würde ausreichen, da ich den Integrationskleber selbst entwickeln kann. Es sollte mich nur Ergebnisse auf einem Linux-Server erzielen lassen, daher wäre eine Linux-kompatible Software besser, aber selbst ein Webdienst mit einer angemessenen Reaktionszeit für eine interaktive Nutzung kann in Ordnung sein.

Nach meinen eigenen Recherchen hätte Open Applicant ein guter Kandidat sein können, da es "Resume Parsing" bereitstellte und freie Software war. Aber leider sieht es so aus, als wäre es aus dem Netz verschwunden.

Unfreie Software, die diese Aufgabe übernehmen kann, umfasst DaXtra Parser , ResumeGrabber, Rchilli Resume Parser und Automated Hr Software Resume Parser.

OrangeHRM kündigt an, dass es „ Shortlist using Resumes Parsing to Read Resumes and Keywords “ integriert, aber ich weiß noch nicht, ob es sich um eine native Lösung handelt oder ob es sich auf SaaS stützt .
Bist du jemals darauf gekommen? Hast du eine Lösung gefunden? Wenn ja, würden Sie eine Antwort posten?
Tut mir leid, ich habe damals keine zufriedenstellende Antwort gefunden, und ich habe nicht vor, weitere Nachforschungen zu diesem Thema anzustellen.
Obwohl der OpenApplicant-Code von Sourceforge sourceforge.net/projects/openapplicant/files verschwunden ist , scheint er hier erhalten geblieben zu sein: en.pianshen.com/1360840
Ich würde vorschlagen, dass Sie das als Antwort posten. Gut gemacht, dass du es gefunden hast. Soweit ich auf der Way back Machine sehen kann, hatte diese Seite nie einen Download-Link web.archive.org/web */ linuxlinks.com/article/20091006152306344/ OpenApplicant.html

Antworten (5)

Angesichts der Tatsache, dass der Ton Ihrer Frage auf Programmiererfahrung hinweist, würde ich vorschlagen, dass dies wahrscheinlich in Python erreicht werden könnte durch:

  1. Konvertieren jedes Lebenslaufs in ein gemeinsames Format, z. B. Markdown oder Klartext:
    • Word .docx Verwenden Sie das eingebaute docx-Modul
    • Word .doc Rufen Sie antiword auf, um es in reinen Text umzuwandeln
    • Pdf, ( nicht gescannte Dokumente), pdfminer
  2. Entweder : Wählen Sie relevante Daten mit einer Reihe von regulären Python-Ausdrücken aus, indem Sie re / regex verwenden. Dies wird Ihnen wahrscheinlich die schnellsten Ergebnisse liefern, aber möglicherweise nicht die umfassendsten, oder :
  3. Analysieren und analysieren Sie mit nltk - dies ist möglicherweise die leistungsfähigere Lösung, erfordert jedoch viel Zeit und Mühe bei der Implementierung.

    • Extrahieren von Name, Nachname, E-Mail, Telefonnummern, segmentierter Postanschrift (Straße, Postleitzahl usw.) in eine verwertbare strukturierte Ausgabe - Ja Ein guter Satz regulärer Ausdrücke sollte dafür ausreichen.
    • Kostenlos - Ja , abgesehen von den Entwicklungskosten
    • Extrahieren anderer typischer Lebenslaufeinträge - Hängt von Ihrem Aufwand ab und erfordert wahrscheinlich die nltk-Lösung .
    • Integration mit OpenERP – da Sie in jedem Format ausgeben können, das Sie benötigen, würde ich sagen, ja, oder Sie könnten einen OpenERP-Client verwenden .
    • Auf einem Linux-Server ausführen - auf jeden Fall .

Ich stieß auf ein weiteres Unternehmen , das Lebensläufe analysiert, www.candidatezap.com. Sie behaupten, Lebensläufe in viele ATS / CRM hochladen zu können, ohne Codierung / Programmierung und ohne Integrationsbedarf.

Hallo! Könnten Sie bitte Ihre Antwort erweitern, um sie eigenständig zu machen? Versuchen Sie, es so zu strukturieren, dass es die 4 Punkte in der OP-Frage beantwortet!

Hier ist ein kostenloser API-Dienst zum Analysieren von Lebensläufen/Lebensläufen, den Sie verwenden können und der ziemlich einfach in Ihre Anwendungen oder Websites zu integrieren ist. Hat einige Beispiele für die .net-Code-Integration auf der Website

Der Link scheint jetzt tot zu sein :-(

Wenn Sie nach einem kostenlosen Lebenslauf-Parser suchen, besuchen Sie https://affinda.com/resume-parser/

Die Ausgabe erfolgt in den Formaten XLS, JSON und XML. Diese Lösung wurde unter Verwendung der neuesten Fortschritte in der Verarbeitung natürlicher Sprache entwickelt, um sicherzustellen, dass sie die breiteste Palette von Lebenslaufformaten verarbeiten kann.

Sie müssten die beschriebene Integration selbst entwickeln, und es sollte einfach sein, da die Ausgabe in einer JSON-Datei erfolgen kann.

Zu den Feldern gehören Name, Standort, Telefon, E-Mail, Websites, Berufserfahrung (Job, Arbeitgeber, Standort, Daten), Ausbildung (Institution, Abschluss, Standort, Daten), Fähigkeiten und mehr.

Hoffentlich hilft das!

Klingt nach einer interessanten Lösung, aber nicht frei wie bei freier Software. Eigentlich eher das Gegenteil, denn es scheint eine reine Cloud-Lösung zu sein.

Unsere CV-Parsing-Software hilft Ihnen, Details aus Lebensläufen zu extrahieren. Normalerweise unterstützt es alle Formate von Lebensläufen.

Könnten Sie einige Details geben. Was ist beispielsweise das Ausgabeformat? XML? Kann es direkt in meine Datenbank schreiben? Auch die Preise (nicht notwendig, um die Frage zu beantworten, aber gut zu wissen). Ich denke, es unterstützt Linux, wie das OP gefragt hat. Windows auch?
Gibt es außerdem irgendwo auf Ihrer Website eine Beispielausgabedatei, damit wir genau sehen können, wie sie aussieht?
Die Ausgabe ist in den Formaten XML und JSON verfügbar. Es hilft, direkt in Ihrer Datenbank, CRM oder ATS zu speichern. Um besser zu dienen, geben Sie bitte hier Ihre Daten ein. ( rcilli.com/contacts ).
Wenn Sie hier Details gepostet hätten, hätten Sie vielen Menschen helfen und viele Nachfrager bekommen können. So wie es ist, würde ich mir einen solchen Service wünschen, werde aber nicht nachfragen, wenn Sie hier keine Details angeben