Korpus PJM to realizowany od roku 2009 projekt gromadzenia danych językowych pochodzących od rodzimych użytkowników PJM. Obecnie zbiór składa się z nagrań wypowiedzi 150 Głuchych z całego kraju.
Wszystkie dane wchodzące w skład korpusu powstają specjalnie na potrzeby tego projektu i są pozyskiwane podczas sesji nagraniowych organizowanych najczęściej w siedzibie PLM. Do udziału w nagraniu zapraszani są rodzimi użytkownicy PJM powyżej 18. roku życia, urodzeni i mieszkający na terenie Polski. W nagraniach bierze udział zrównoważona liczba kobiet i mężczyzn, reprezentujących różne grupy wiekowe, o zróżnicowanym wykształceniu i pochodzeniu, co wynika z dążenia do reprezentatywności danych językowych.
Sesja nagraniowa obejmuje zawsze parę informatorów. Dzięki temu możliwe jest uzyskanie naturalnych dialogów, a tym samym także różnorodnych konstrukcji składniowych. Dialogowy charakter sesji pomaga również jej uczestnikom szybciej przyzwyczaić się do obecności kamer i innych części wyposażenia studia nagraniowego. W studiu nagraniowym oprócz informatorów obecny jest głuchy moderator sesji, który czuwa nad jej przebiegiem i wyjaśnia niezrozumiałe kwestie, nie ingeruje jednak w wypowiedzi samych nagrywanych. Językiem kontaktowym jest wyłącznie PJM.
Każde z zadań informatorzy wykonują w parze, relacjonując sobie obejrzane materiały, dyskutując na wybrane tematy, dokonując wspólnych ustaleń itp. Materiałami wywoławczymi są rysunki, klipy filmowe, plansze z obrazkami, mapki. Z zasady w zadaniach unika się pośrednictwa języka polskiego. Informatorzy nie znają wcześniej swoich zadań. Każde z nich poprzedzone jest instrukcją odtwarzaną przez moderatora — są to nagrane uprzednio filmy w PJM, takie same dla wszystkich uczestników nagrań.
Zgromadzone dane są następnie anotowane w programie iLex – przeprowadzany jest ich podział na pojedyncze znaki, lematyzacja, tagowanie, transkrypcja artykulacyjna w notacji HamNoSys oraz tłumaczenie poszczególnych zdań w PJM na język polski. Anotacja umożliwia m.in. przeszukiwalność korpusu.
Zgromadzone dane korpusowe umożliwiają prowadzenie rzetelnych i opartych na dużym materiale językowym badań lingwistycznych, ma także niezwykłą wartość jako skarbiec kultury Głuchych i archiwum
języka migowego, zwłaszcza starszego pokolenia niesłyszących. W związku z brakiem szeroko używanej notacji PJM zbiór danych wideo jest jedyną drogą do utrwalenia obecnego kształtu języka migowego i zachowania go dla kolejnych pokoleń — zarówno dla członków społeczności Głuchych, jak i dla badaczy.
Korpus to również istotny czynnik zapobiegający deprecjacji języka migowego oraz wspierający emancypację samych Głuchych, którzy dzięki tego typu projektom powinni być utwierdzani w poczuciu wartości własnego języka.
Więcej informacji na temat korpusu PJM można znaleźć m.in. w następujących książkach i artykułach:
Lingwistyka przestrzeni i ruchu. Komunikacja migowa a metody korpusowe
Korpus polskiego języka migowego (PJM): założenia – procedury – metodologia
Jak powstaje korpus polskiego języka migowego?
oraz w innych pracach zespołu PLM dostępnych w zakładce publikacje.