Computerlesbare Informationen mit gekennzeichneten Rechnungen

Gibt es Websites mit Rechnungen, Beschlüssen usw., die mit computerlesbaren themenspezifischen Tagging-Informationen gekennzeichnet sind, wie z.

Apropos -> HR 3547: „Space Launch Liability Indemnification Extension Act“. Es könnte mit „Nasa“, „Forschung“ und anderen (umstrittenen, da bin ich mir sicher) Tags versehen sein.

Was hoffen Sie zu erreichen? Vielleicht stellst du die falsche Frage.
Es gibt viele Verwendungsmöglichkeiten für diese Art von Informationen. Aber mein besonderes Interesse gilt einem Programmierprojekt zur Demonstration für eine Klasse, das Abstimmungsmuster auf Themen abbildet. Kongressabgeordneter stimmt mit „Ja“ für Gesetzentwürfe, die mit „NASA“ gekennzeichnet sind.
Müssen die Rechnungen „getaggt“ werden? Würde eine einfache Textsuche in der gesamten Rechnung nicht ausreichen?
Ich müsste ihm eine Liste von Gegenständen mitteilen, nach denen gesucht werden soll, und wenn ich mich auf den Computer verlassen würde, um das zu tun, wäre das für mich eine völlig andere Klasse, die die Verarbeitung natürlicher Sprache verwendet. Ich wollte Graphentheorie.
@ user1873 - HÖLLE NEIN. Korrekte semantische Textanalyse ist schwierig
Vor allem bei etwas so Verworrenem wie dem Text von Rechnungen! -------- Ist dies hier auch ein Thema, im Gegensatz zu Programmers.SE oder SO?
Ich denke, die maschinelle Lesbarkeit von Rechnungen hilft den Menschen, Daten zu synthetisieren, um eine informierte Öffentlichkeit zu erreichen. Deshalb denke ich, dass es Teil jeder politischen Diskussion sein sollte. Ganz zu schweigen davon, dass ich eine Zielgruppe getroffen und eine Antwort bekommen habe.
@Bobson Nachdem ich mir die Fülle von Stack-Exchange-Sites angesehen hatte, fand ich eine, die möglicherweise besser geeignet war. Wenn also jemand genug Status hat, um eine Frage auf diese Seite zu verschieben, dann machen Sie es. opendata.stackexchange.com

Antworten (2)

Ich habe mich nicht allzu tief damit befasst, aber GovTrack.US scheint eine API zu haben, die Sie verwenden können

https://www.govtrack.us/developers

https://www.govtrack.us/developers/api


Es sieht auch so aus, als ob Sie nach Themengebieten nach Rechnungen suchen können, was meiner Meinung nach den Tags, nach denen Sie suchen, sehr ähnlich ist.

Bedingungen:

Mit dem Gesetzentwurf verbundene Themenbereiche. Wird als Liste von JSON-Diktaten (oder Äquivalenten in anderen Ausgabeformaten) zurückgegeben. Wird nur in einer Abfrage für ein einzelnes Objekt zurückgegeben.

Mit Operatoren filterbar. Sortierbar. Geben Sie beim Filtern die ID eines >Zielobjekts an, um zu testen, ob sich das Ziel unter den Werten dieses Felds befindet.

Und nach ihren Seiten zu urteilen, scheinen sie viele andere Metriken zu haben, die Sie verwenden können.

Die offizielle Website des Kongresses ( Congress.gov ), die Thomas.Gov ersetzt hat, enthält den Text und den Status der meisten Gesetzentwürfe, aber keine API. Wie dieser Artikel erklärt , ging das Ziel, die Website zu modernisieren, nicht sehr weit mit offenen Standards.

Zusätzlich zu https://www.govtrack.us/ , das über eine API verfügt, sollten Sie sich auch die nichtstaatliche https://www.opencongress.org/ ansehen , die ähnliche Daten enthält. Insbesondere verfolgt Open Congress Rechnungen und hat einen Link https://www.opencongress.org/issues für Probleme, die sie auf eine Weise aggregiert haben.

Darüber hinaus wird die Entwicklung einer "offiziellen" Taxonomie für Rechnungen, die von einer Regierungsorganisation verwaltet werden, höchstwahrscheinlich ziemlich schwierig sein. Wenn es der staatlichen Aufsicht zugänglich wäre, wäre der Druck auf einen Kongressabgeordneten, das System mit seinen Etiketten zu spielen, erheblich, was seine Wirksamkeit verringern würde. Je nachdem, ob ein Interessent möchte, dass der Gesetzentwurf mehr oder weniger bekannt ist (was sich direkt auf seine Verabschiedungschancen auswirkt), wäre die Versuchung, an seiner Klassifizierung herumzuspielen, einfach zu groß.

WAHR. Das Fummeln von Tags würde passieren. Das setzt eine Wichtigkeit von ein paar Tags voraus. Aber wenn eine Rechnung 10-20 weniger wichtige Tags hätte (ganz zu schweigen von den Fahrer-Tags), dann hätten Sie ein klareres Bild der Gedanken der vollständigen Rechnung.