§0. Kaćja (kaćjański) jest językiem o nieokreślonej przynależności genetycznej i o mieszanej pod wieloma względami typologii. Najprawdopodobniej stanowi pozostałość odrębnej grupy języków nostratyckich. Wykazuje nawiązania do różnych rodzin językowych, w tym do języków indoeuropejskich. Jest językiem bogatym w słownictwo; często wyraz o prostej strukturze ma synonimy opisowe.
§1. Cechą charakterystyczną jest interesująca morfologia, w której obowiązuje ścisła i bezwyjątkowa harmonia samogłosek kardynalnych a, e, o. Samogłoski te podlegają skomplikowanemu systemowi apofonii, związanej ze zmianami miejsca akcentu. Akcent odgrywa rolę gramatyczną. Jest swobodny, ruchomy (choć ruchomość ta jest znacznie ograniczona) i w pewnej mierze przewidywalny, zwłaszcza w koniugacji. Dość skomplikowany jest konsonantyzm, choć brak jest złożonych grup spółgłosek. Spółgłoska h często ginie w wymowie lub wymienia się do samogłoski centralnej ə, a spółgłoski j, w (o wymowie zob. §20) wymieniają się do samogłosek wysokich i, u, tworzą też różne dwugłoski. Spółgłoski płynne i nosowe mają odmiany sylabiczne. W zasadzie brak jest rdzeni rozpoczynających się od samogłosek kardynalnych, choć istnieje kilka wyjątków.
Wymowa kaćjańska może powodować pewne problemy, gdyż kaćjański zawiera głoski nieobecne w polskim: sonanty (§13), ə, þ, [ð], h, [ɦ], poza tym ŋ u nas występuje tylko przed k, g (np. w wyrazie ręka [reŋka]), a w kaćjańskim może wystąpić w dowolnej pozycji. Problemy może też sprawiać dwuwargowa wymowa f jako [φ] lub [β], odróżnianie h od x, ća od ćja. czy ći od či. Dobrym przykładem ilustrującym trudności fonetyki kaćjańskiej jest wyraz mofŋogi ‘złamałem to’ z uwagi na niezwykłe (dla nas) połączenie kaćjańskiego dwuwargowego f z tylnojęzykowym ŋ rozpoczynającym sylabę.
§2. Kaćja należy do typu mieszanego: znajdujemy w nim elementy typów akuzatywnego, ergatywnego i aktywnego. W morfologii spotykamy zarówno elementy fleksji, jak i aglutynacji, występują też luźne wyrazy gramatyczne jak w językach izolujących. Istnieje podział na 3 części mowy: deklinowalne (imiona), koniugowalne (słowa) i nieodmienne (partykuły). Wyrazy będące odmiennymi częściami mowy składają się z rdzenia (który może być podwojony w formach z reduplikacją), afiksów słowotwórczych oraz morfemów fleksyjnych. Osobliwością języka kaćjańskiego jest pewien udział elementów prefiksalnych zarówno wśród afiksów, jak i morfemów, obok dominujących elementów sufiksalnych.
Wielce osobliwa jest budowa rdzenia. Rdzenie odmiennych części mowy składają się mianowicie z 2, 3 lub 4 niezmiennych spółgłosek (o nielicznych wypadkach naruszających tę zasadę będzie mowa w §25), oraz z jednej z trzech samogłosek kardynalnych (a, e, o). Samogłoski te podlegają rozbudowanym wymianom ilościowym w odmianie i słowotwórstwie, ściśle związanym ze zmianami miejsca akcentu. Nie ma, nawet wśród zapożyczeń, odmiennych wyrazów nieposiadających jednej z tych trzech samogłosek (dlatego np. wyraz guru zapożyczono jako gouru). Samogłoski kardynalne nie podlegają w zasadzie wymianom jakościowym pomiędzy sobą, z wyjątkiem wypadków o czysto leksykalnym charakterze. Wszystkie samogłoski kardynalne w danym wyrazie muszą mieć tę samą barwę (stąd właśnie ścisła harmonia wokaliczna), ta sama samogłoska pojawia się też wszędzie w danej rodzinie wyrazowej, we wszystkich przyłączanych afiksach i przy wszystkich spółgłoskach rdzenia. Istnieją zatem 3 klasy wyrazów odmiennych: klasa A, klasa E i klasa O. Podział ten obejmuje także wszystkie odmienne zapożyczenia. Samogłoski wysokie i, u oraz samogłoska centralna ə nie podlegają harmonii wokalicznej.
§3. Imiona w kaćjańskim odmieniają się przez przypadki i osoby, istnieje też kategoria rodzaju gramatycznego, w większym stopniu naturalnego niż w polskim. Z uwagi na typ odmiany wyróżnić można co najmniej 10 klas imiennych. Przynależność do danej klasy i do danego rodzaju wpływa na łączliwość z określonymi końcówkami przypadków. Przymiotniki odmieniają się jak rzeczowniki, tworząc jednak osobne formy dla poszczególnych rodzajów. System liczenia jest dziesiątkowy, a liczebniki 1–4 tworzą odrębne formy dla poszczególnych rodzajów i przypadków. Składnia liczebników przypomina polską, gdyż liczebnik 5 i wyższe często wchodzą z liczonym wyrazem w związek rządu (choć z innym przypadkiem niż u nas). W odmianie liczebników niższych obowiązuje zasadniczo składnia zgody, ale liczony przedmiot często pozostaje w liczbie pojedynczej. Interesujący jest fakt, że niemal wszystkie liczebniki mają etymologiczne nawiązania w językach indoeuropejskich. Oryginalne jest częste użycie liczebnika o znaczeniu ‘1’, który właściwie funkcjonuje jako rodzajnik nieokreślony, przy braku rodzajnika określonego. Niezwykle osobliwe są odpowiedniki zaimków, o czym w części szczegółowej.
§4. Koniugacja pod pewnymi względami przypomina polską, gdyż występuje pięć prostych form czasowych, z których dwie odnoszą się do przeszłości i dwie do przyszłości. Podobnie jak w językach słowiańskich, różnicą znaczeniową w tych parach jest aspekt, lecz tworzenie form aspektowych jest regularne. Istnieją 3 czasowniki specjalne o nietypowej budowie i odmianie, poza tym uderza brak jakichkolwiek czasowników nieregularnych, jednak zasady tworzenia form od tzw. rdzeni słabych bywają skomplikowane. Inną osobliwością jest fakt, że formy osobowe czasowników przybierać mogą afiksy dla oznaczenia zarówno podmiotu, jak i przedmiotu, ale dopuszczalne są też formy bezafiksalne, których znaczenie determinuje tylko kontekst. Istnieje kategoria trybu, w szczególny sposób wyrażana jest kategoria strony.
§5. Osobliwości składni zdeterminowane są w dużej mierze przez system przypadków. Wyrazy pełniące rolę przyimków (genetycznie są to rzeczowniki lub partykuły) mogą zmieniać się w poimki, a także łączyć się z czasownikiem jako prefiksy, a proces ten bywa dowolny w określonych sytuacjach. Pozycja wyrazów w zdaniu bywa bardzo zmienna, przeważają jednak dwa typy: podmiot – dopełnienie bliższe – orzeczenie i orzeczenie – podmiot – dopełnienie bliższe. Pozycja z inicjalnym orzeczeniem przeważa w aspekcie dokonanym. Dopełnienie dalsze, zwłaszcza wyrażone celownikiem, występuje często tuż po orzeczeniu, niezależnie od jego pozycji w zdaniu. Przydawka zwykle poprzedza określany rzeczownik, choć zdarzają się także przypadki przydawek postpozycyjnych. Liczebnik zawsze poprzedza liczony przedmiot, z wyjątkiem liczebnika ‘1’, który w wypowiedziach nienacechowanych zajmuje drugą pozycję w grupie (po liczonym rzeczowniku, a w przypadku grup z przydawką przymiotnikową po przymiotniku, a przed rzeczownikiem).
§6. Do zapisu języka kaćjańskiego używa się alfabetu łacińskiego z dodatkiem kilku znaków specjalnych: ə (szwa), ŋ (nga), þ (thorn). Wykształciła się ustalona norma ortograficzna. Pismo nie jest czysto fonetyczne, ale istnieje tylko jeden sposób odczytania istniejącego zapisu. Alfabet kaćjański składa się z 32 liter i przedstawia się następująco: a, b, c, č, ć, d, e, f, g, ə, h, i, j, k, l, m, n, ŋ, o, p, r, s, š, ś, t, u, w, x, z, ž, ź, þ. Nietypowa pozycja litery ə wynika ze związku tej samogłoski z laryngalną h. Końcowa pozycja þ przypomina alfabet islandzki.
Nazwy większości liter po kaćjańsku zawierają samogłoskę e, np. b to be, j to je itd. Jak w polskim, samogłoski a, e, o noszą nazwy takie, jak ich brzmienie. Samogłoski ə, i, u nazywają się odpowiednio ah (o wymowie zob. §22), ei, ou.
§7. Transkrypcję (również poniżej w niniejszym zarysie) podaje się w nawiasach kwadratowych, używając liter alfabetu kaćjańskiego dla oddania ich typowych wartości fonetycznych. Dodatkowo wprowadza się znaki ʒ, ǯ, ʒ́ oznaczające dźwięczne afrykaty, odpowiadające polskim dz, dż, dź. Znaki v, ð, ɣ, ɦ używane są dla oddania dźwięcznych wariantów spółgłosek f, þ, x, h, znaki φ, β oznaczają dwuwargowe warianty f, v. Akut nad samogłoską oznacza (jak w ortografii) miejsce akcentu, np. zura [ʒurá] ‘koszula’. Wyjątkowo stosuje się kółko pod symbolem litery dla oznaczenia sylabiczności sonantu (jak w indoeuropeistyce, np. [hapkm̥na]) oraz łuczek pod literą dla oznaczenia niezgłoskotwórczych wariantów i, u, występujących jako drugi człon dyftongów zstępujących, a także dla niemego h, np. [pah̯], [pau̯h̯]. Częściej dla oddania tych samych cech wymowy sylaby rozdziela się znakiem łącznika, np. [hap-km-na]. Obowiązuje również konwencja, że gwiazdka poprzedza formy rekonstruowane, dwie gwiazdki – formy niedopuszczalne w systemie języka. Specjalną symbolikę opracowano dla przedstawienia kaćjańskiego rdzenia i struktur charakteryzujących określone formy gramatyczne. Symbolikę tę przedstawiono w części szczegółowej.