Denna artikel bakom kulisserna tillhandahölls LiveScience i samarbete med National Science Foundation.
Jag måste älska Cubbies. Tack vare dem är en databas med amerikanska högsta domstolens ljudinspelningar nu tillgänglig för allmänheten. För mycket av en sträcka? Inte riktigt, för verktyget växte ut ur en mans kärlek till Chicago Cubs, teknik och studiet av rätt.
En solig eftermiddag på Wrigley Field för 20 år sedan satt Jerry Goldman, då en professor i statsvetenskap vid Northwestern University, i blekarna och njöt av ett spel med ett par studenter. De betraktade sätt som baseball är en metafor för den amerikanska högsta domstolen: nio spelare, nio rättvisar. Ett spel aktiverar fantastiska platser och fantastiska fångster; den andra om muntliga argument och tankeväckande avgöranden.
Om baseballkort förklarade viktiga detaljer om en spelares karriär, tänkte Goldman, varför inte skapa kort för rättvisarna och lägga till video och ljud? Projektet verkade uppnåeligt med tanke på HyperCard, ett applikations- och programmeringsverktyg för tidiga Apple-datorer. "Mina kollegor tyckte att jag var galen", säger Goldman, nu professor vid Illinois Institute of Technology (IIT) Chicago-Kent College of Law. "Men jag trodde att informationstekniken skulle förändra hur världen fungerade."
Goldmans strävan att ”verkligen humanisera Högsta domstolen” ledde till utvecklingen av det NSF-finansierade Oyez-projektet, ett multimediaarkiv som innehåller en sökbar trove av muntliga argument som domstolen har hört sedan 1955. En app för mobila enheter, ISCOTUSnu är också tillgänglig.
"Det huvudsakliga målet var att ta bort domstolen från upphöjd status och föra den till allmänheten," säger Goldman. "Vi ville också tillhandahålla den stora mängden information som är kopplad till domstolen."
Skapa sökbart ljud och video
För att få Högsta domstolen till liv, övertalade Goldman först Nationalarkivet, som lagrar domstolens ljudfiler, för att tillåta honom att kopiera banden för transkription och digitalisering. För att göra de nyligen digitaliserade audiotapen sökbara, samarbetade Goldman med Mark Liberman, en beräkningsspråklig professor vid University of Pennsylvania. Liberman anpassade en algoritm som kan matcha ljud på audiotapes med skriftliga transkript. Detta arbete ledde så småningom till utvecklingen av Penn Forced Aligner, ett verktyg som nu vanligtvis används för att anpassa talade ljud med skriven text.
"Vi skapade i grunden en Google-liknande sökmotor för ljud- och videoinspelningar," säger Liberman, som drogs till uppgiften på grund av arkivens värde för forskare och allmänheten. Han välkomnade också möjligheten att skapa en sökteknik som är tillämplig på de växande samlingarna av ljud- och videoinspelningar som finns tillgängliga från många olika källor.
”E kunde ställa in en modell för hur man kan komma till sökningar på ett kostnadseffektivt sätt. Detta kan verka som ett stort projekt, men det är litet jämfört med vad som nu finns tillgängligt online och vad som kommer att bli i framtiden, säger Liberman.
(Nyligen använde Libermans kollegor vid Oxford University och British Library justeringsverktygen för att dechiffrera inspelningar av British National Corpus, ett arkiv med en talad del på 100 miljoner ord samlade från deltagare som spelade in sitt tal på Sony Walkmans.)
Analysera data
Därefter analyserade Goldman nästan 14 000 timmar ljud av muntliga argument från Högsta domstolen. "Det finns otaliga frågor du kan ställa om datasatsen," säger han. "Detta är dock ett ovanligt datasätt eftersom det har flera högtalare och är spontant." En av de första uppgifterna var att identifiera varje talare i varje muntligt argument - en utmaning, eftersom ungefär 11 talare kunde vara involverade i ett argument. Dessutom har transkripten under många år inte taggat frågor med rättvisans namn.
Goldman och hans kollaboratörer - som inkluderade kollegor från Carnegie Mellon University och University of Minnesota - samlade samtidigt ett antal intressanta fakta om domstolens arbete sedan 1955:
- 32 domstolar över 58 år
- 8 600 förespråkare, varav 70 procent dök upp för domstolen bara en gång
- 66 miljoner ord som talas
- Mer än 6.100 ärenden och mer än 2.300 yttranden
- Längsta argument - 1300 minuter
- Kortaste argument - 14 minuter
Rättvisa Antonin Scalia, som har tjänat 27 år på domstolen, har rekordet för de mest pratsamma, med 7 200 minuter, medan Felix Frankfurter, som tjänade 23,5 år, kommer inom en nära sekund på 7 000 minuter. De mest behållna rättvisarna är Sherman Minton och Clarence Thomas. Även om Minton tjänade på domstolen i sju år är det bara hans sista år på rekord. Under sin sista period hörs han bara 17 minuter. Thomas, på domstolen sedan 1991, klockar in på 23 minuter.
Medan Oyez-projektet ger juridiska forskare en mängd material att gruva, analyserar språkforskare också inspelningarna för olika studier.
Tar domstolen till folket
För att säkerställa att allmänheten och akademiker kan undersöka informationen med lätthet fortsätter Goldmans team att göra förbättringar och utveckla gränssnittet. Hösten 2013 kommer sökfunktioner att läggas till datasystemet för att hjälpa användare att djupa djupare i materialet. Den här nya sökfunktionen kommer till exempel att göra det möjligt för användare att "söka efter termen" strikt granskning ", se det i transkriptet, lyssna på det och sedan göra vad lyssnarna vill göra med det", förklarar Goldman.
Chicagoansarna är förtjust i att säga, ”Gör inga små planer.” Goldman stämmer med detta uttalande. Han vill tillämpa de verktyg som utvecklats i Högsta domstolsprojektet på alla amerikanska överklagadomstolar. Planen är att utveckla webbplatser och applikationer för mobila enheter. Nyligen tilldelade Knight Foundation Oyez-projektet $ 600 000 för att utföra detta arbete för de högsta domstolarna i Kalifornien, Florida, Illinois, New York och Texas.
"Apparna är den coolaste delen", säger Goldman. De kommer att följa ISCOTUS designnu, som är ett samarbete mellan Goldman och Caroline Shapiro, också professor vid IIT Chicago-Kent College of Law. ISCOTUSnu ger tillgång till allt på den nuvarande högsta domstolsdockan, och inkluderar ljud och avskrifter. Med en enkel rörelse kan en användare bläddra igenom ett transkript, söka i det och dela ett avsnitt med kollegor. "Den bästa delen?" säger Goldman. "All denna information är gratis."
Omfattningen av Oyez-projektet var en som Goldman aldrig föreställde sig. ”Utan NSF-stöd skulle vi fortfarande kämpa,” säger han. "NSF: s stöd gav mig modet att tänka på några små tankar."
Redaktörens anmärkning: Forskarna som visas i Bakom kulisserna har artiklar stött av Nationella vetenskapsfonden, den federala byrån som ansvarar för att finansiera grundforskning och utbildning inom alla vetenskaps- och teknikområden. Alla åsikter, fynd och slutsatser eller rekommendationer som uttrycks i detta material är författarnas och avspeglar inte nödvändigtvis National Science Foundations åsikter. Se Bakom kulissarkivet.