C (programozási nyelv)

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2022. augusztus 4-én felülvizsgált verziótól ; az ellenőrzések 3 szerkesztést igényelnek .

C

Nyelvóra	eljárási
A végrehajtás típusa	összeállított
Megjelent	1972
Szerző	Dennis Ritchie
Fejlesztő	Bell Labs , Dennis Ritchie [1] , US National Standards Institute , ISO és Ken Thompson
Fájlkiterjesztés _	.c— kódfájlokhoz, .h— fejlécfájlokhoz
Kiadás	ISO/IEC 9899:2018 (2018. július 5. )
Típusrendszer	statikus gyenge
Főbb megvalósítások	GCC , Clang , TCC , Turbo C , Watcom , Oracle Solaris Studio C, Pelles C
Dialektusok	"K&R" C ( 1978 ) ANSI C ( 1989 ) C99 ( 1999 ) C11 ( 2011 )
Befolyásolva	BCPL , B
befolyásolta	C++ , Objective-C , C# , Java , Nim
OS	Microsoft Windows és Unix-szerű operációs rendszer
Médiafájlok a Wikimedia Commons oldalon

ISO/IEC 9899
Információtechnológia — Programozási nyelvek — C
Kiadó	Nemzetközi Szabványügyi Szervezet (ISO)
Weboldal	www.iso.org
Bizottság (fejlesztő)	ISO/IEC JTC 1/SC 22
bizottság honlapja	Programozási nyelvek, környezetük és rendszerszoftver interfészek

ISS (ICS)	35.060

Aktuális kiadás	ISO/IEC 9899:2018
Korábbi kiadások	ISO/IEC 9899:1990/COR2:1996 ISO/IEC 9899:1999/COR3:2007 ISO/IEC 9899:2011/COR1:2012

A C (a latin C betűből , angol nyelv ) egy általános célú lefordított, statikusan tipizált programozási nyelv , amelyet 1969-1973-ban a Bell Labs alkalmazottja, Dennis Ritchie fejlesztett ki a Bee nyelv továbbfejlesztéseként . Eredetileg a UNIX operációs rendszer megvalósítására fejlesztették ki , de azóta sok más platformra is portolták . Tervezésénél fogva a nyelv szorosan illeszkedik a tipikus gépi utasításokhoz , és olyan projektekben is használható, amelyek az assembly nyelven natívak voltak , beleértve az operációs rendszereket és a különféle alkalmazásszoftvereket különféle eszközökhöz, a szuperszámítógépektől a beágyazott rendszerekig . A C programozási nyelv jelentős hatással volt a szoftveripar fejlődésére, szintaxisa olyan programozási nyelvek alapjává vált, mint a C++ , C# , Java és Objective-C .

Történelem

A C programozási nyelvet 1969 és 1973 között fejlesztette ki a Bell Labs , és 1973 -ra az eredetileg PDP-11 /20 assemblerben írt UNIX kernel nagy részét átírták erre a nyelvre. A nyelv elnevezése a régi „ Bi ” [a] nyelv logikai folytatása lett , melynek számos jellemzőjét vették alapul.

A nyelv fejlődésével először ANSI C néven szabványosították, majd ezt a szabványt az ISO nemzetközi szabványügyi bizottság ISO C néven, más néven C90 néven vette át. A C99 szabvány új funkciókkal bővítette a nyelvet, mint például változó hosszúságú tömbök és soron belüli függvények. A C11 szabványban pedig a streamek megvalósítása és az atomtípusok támogatása került a nyelvbe. Azóta azonban a nyelv lassan fejlődött, és csak a C11 szabvány hibajavításai kerültek be a C18 szabványba.

Általános információk

A C nyelvet rendszerprogramozási nyelvnek tervezték, amelyhez egymenetes fordító is létrehozható . A standard könyvtár is kicsi. Ezen tényezők következtében a fordítók viszonylag könnyen fejleszthetők [2] . Ezért ez a nyelv számos platformon elérhető. Ráadásul alacsony szintű jellege ellenére a nyelv a hordozhatóságra összpontosít. A nyelvi szabványnak megfelelő programok különböző számítógép-architektúrákhoz fordíthatók.

A nyelv célja az volt, hogy egyszerűbbé tegye a nagy programok minimális hibával történő írását az assemblerhez képest, a procedurális programozás elveit követve , de elkerülve mindazt, ami a magas szintű nyelvekre jellemző többletköltséget jelentene.

A C főbb jellemzői:

egy egyszerű nyelvi bázis, amelyből számos lényeges tulajdonság, például matematikai függvények vagy fájlfüggvények kerültek a szabványos könyvtárba ;
eljárási programozási orientáció ;
típusú rendszer , amely véd az értelmetlen műveletek ellen;
előfeldolgozó használata hasonló műveletek elvonatkoztatására;
a memóriához való hozzáférés mutatók használatával ;
kevés kulcsszó;
paraméterek átadása egy függvénynek értékkel, nem hivatkozással (a hivatkozás szerinti átadást mutatók emulálják);
függvényekre és statikus változókra mutató mutatók jelenléte ;
név hatókörök;
A struktúrák és az uniók a felhasználó által definiált kollektív adattípusok, amelyek egyként kezelhetők.

Ugyanakkor C-ből hiányzik:

beágyazott függvények;
több érték közvetlen visszaadása a függvényekből;
korutinok ;
automatikus memóriakezelés eszközei ;
beépített eszközök objektum-orientált programozáshoz ;
funkcionális programozási eszközök .

A hiányzó funkciók egy része beépített eszközökkel szimulálható (például a korutinok szimulálhatók a setjmpéslongjmp függvényekkel ), néhány pedig harmadik féltől származó könyvtárak segítségével adható hozzá (például a többfeladatos és hálózati funkciók támogatásához használhatja a könyvtárak pthreads , sockets és hasonlók; vannak olyan könyvtárak, amelyek támogatják az automatikus szemétgyűjtést [3] ), egyes fordítóprogramok egy részét nyelvi kiterjesztésként implementálják (például beágyazott függvények a GCC -ben ). Létezik egy kissé körülményes, de meglehetősen működő technika, amely lehetővé teszi az OOP mechanizmusok megvalósítását C-ben [4] , amely a C-beli mutatók tényleges polimorfizmusán és a függvényekre mutató mutatók támogatásán alapul ezen a nyelven. Az ezen a modellen alapuló OOP-mechanizmusok a GLib könyvtárban vannak implementálva, és aktívan használatosak a GTK+ keretrendszerben . A GLib egy alaposztályt biztosít GObject, amely egyetlen osztályból örököl [5] és több interfészt [6] valósít meg .

A nyelv bevezetésekor kedvező fogadtatásra talált, mert lehetővé tette az új platformokhoz való fordítóprogramok gyors létrehozását , és lehetővé tette a programozók számára, hogy meglehetősen pontosak legyenek programjaik végrehajtásában. Az alacsony szintű nyelvekhez való közelsége miatt a C programok hatékonyabban futottak, mint sok más magas szintű nyelven írottak, és csak a kézzel optimalizált assembly nyelvi kód futhatott még gyorsabban, mert teljes irányítást adott a gép felett. A fordítóprogramok fejlődése és a processzorok bonyolítása a mai napig oda vezetett, hogy a kézzel írt assembly kódnak (talán nagyon rövid programok kivételével) gyakorlatilag nincs előnye a fordító által generált kóddal szemben, míg a C továbbra is az egyik legjobb. hatékony magas szintű nyelvek.

Szintaxis és szemantika

Tokenek

Nyelvi ábécé

A nyelv a latin ábécé összes karakterét használja , számokat és néhány speciális karaktert [7] .

Az ábécé összetétele [7]

Latin ábécé karakterei	A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, , , W_ X_ Y_ Z a_ b_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _cdefghijklmnopqrstuvwxyz
Számok	0, 1, 2, 3, 4, 5, 6, 7, 8,9
Különleges szimbólumok	, (vessző) , ;, . (pont) , +, -, *, ^, (és & ) , =, ~ (tilde) , !, /, <, >, (, ), {, }, [, ], \|, %, (aposztróf)? , (idézőjelek) , (kettőspont) , ( aláhúzás ) ) , ,' " : _ \#

A tokenek érvényes karakterekből - előre definiált konstansokból , azonosítókból és műveleti jelekből - jönnek létre . A lexémák viszont a kifejezések részét képezik ; az utasítások és az operátorok pedig kifejezésekből épülnek fel .

Amikor egy programot C nyelvre fordítunk, a programkódból kivonják a maximális hosszúságú, érvényes karaktereket tartalmazó lexémákat. Ha egy program érvénytelen karaktert tartalmaz, akkor a lexikális elemző (vagy fordító) hibát generál, és a program fordítása lehetetlen lesz.

A szimbólum #nem lehet semmilyen token része, és a előfeldolgozóban használatos .

Azonosítók

Az érvényes azonosító olyan szó, amely tartalmazhat latin karaktereket, számokat és aláhúzásjeleket [8] . Azonosítókat az operátorok, konstansok, változók, típusok és függvények kapják.

A kulcsszóazonosítók és a beépített azonosítók nem használhatók programobjektum azonosítóként. Vannak fenntartott azonosítók is, amelyeknél a fordító nem ad hibát, de amelyek a jövőben kulcsszavakká válhatnak, ami összeférhetetlenséghez vezet.

Csak egy beépített azonosító van - __func__, amely egy konstans karakterláncként van definiálva, amely implicit módon deklarált minden függvényben, és tartalmazza a nevét [8] .

Literális állandók

A C-ben speciálisan formázott literálokat konstansoknak nevezzük. A szó szerinti állandók lehetnek egészek, valós számok, karakterek [9] és karakterláncok [10] .

Az egész számok alapértelmezés szerint decimálisan vannak megadva . Ha egy előtag van megadva 0x, akkor hexadecimális formában van megadva . A 0 előtag azt jelzi, hogy a szám oktálisan értendő . Az utótag megadja az állandó típus minimális méretét, és azt is meghatározza, hogy a szám előjeles vagy előjel nélküli. A végső típust a lehető legkisebbnek vesszük, amelyben az adott konstans ábrázolható [11] .

Az adattípusok egész konstansokhoz való hozzárendelésének sorrendje értékük szerint [11]

Utótag	Tizedesjegyhez	Oktális és hexadecimális számokhoz
Nem	int long long long	int unsigned int long unsigned long long long unsigned long long
uvagyU	unsigned int unsigned long unsigned long long	unsigned int unsigned long unsigned long long
lvagyL	long long long	long unsigned long long long unsigned long long
uvagy Uegyütt lvagyL	unsigned long unsigned long long	unsigned long unsigned long long
llvagyLL	long long	long long unsigned long long
uvagy Uegyütt llvagyLL	unsigned long long	unsigned long long

Példák valós szám írására 1.5

Decimális formátum	Kitevővel	Hexadecimális formátum
1.5	1.5e+0	0x1.8p+0
	15e-1	0x3.0p-1
	0.15e+1	0x0.cp+1

A valós számállandók alapértelmezés szerint típusúak double. Utótag megadásakor fa típus hozzá van rendelve a konstanshoz , a vagy - floatmegadásakor pedig . Egy konstans akkor tekinthető valósnak, ha tartalmaz egy pontjelet vagy egy betűt, vagy ha hexadecimális jelölés van előtaggal . A decimális jelölés tartalmazhat kitevőt a vagy betűk után . Hexadecimális jelölés esetén a kitevő a betűk után van megadva, vagy kötelező, ami megkülönbözteti a valódi hexadecimális állandókat az egész számoktól. Hexadecimálisban a kitevő 2 hatványa [12] . lLlong doublepP0xeEpP

A karakterkonstansok idézőjelek közé ( ') vannak zárva, és az előtag megadja a karakterkonstans adattípusát és azt a kódolást, amelyben a karakter megjelenik. C-ben az előtag nélküli karakterkonstans int[13] típusú , ellentétben a C++ -val , ahol a karakterkonstans char.

Karakterállandó előtagok [13]

Előtag	Adattípus	Kódolás
Nem	int	ASCII
u	char16_t	16 bites többbájtos karakterlánc kódolás
U	char32_t	32 bites többbájtos karakterlánc kódolás
L	wchar_t	Széles karakterlánc kódolás

A karakterlánc-literálok dupla idézőjelek közé vannak zárva, és előtagként szerepelhet a karakterlánc adattípusa és kódolása. A karakterlánc-literálok sima tömbök. A többbyte-os kódolásokban, például az UTF-8- ban azonban egy karakter egynél több tömbelemet is elfoglalhat. Valójában a string literálok const [14] , de a C++-tól eltérően adattípusaik nem tartalmazzák a módosítót const.

Karakterlánc-konstans előtagok [15]

Előtag	Adattípus	Kódolás
Nem	char *	ASCII vagy többbyte-os kódolás
u8	char *	UTF-8
u	char16_t *	16 bites többbájtos kódolás
U	char32_t *	32 bites többbájtos kódolás
L	wchar_t *	Széles karakterlánc kódolás

Több egymást követő, szóközzel vagy újsorral elválasztott karakterlánc-állandót egyetlen karakterláncba vonnak össze fordításkor, amelyet gyakran használnak egy karakterlánc kódjának stíluszására úgy, hogy a karakterlánc-konstans részeit elválasztják a különböző sorokban az olvashatóság javítása érdekében [16] .

Elnevezett konstansok Az állandók beállítási módszereinek összehasonlítása [17]

Makró	#define BUFFER_SIZE 1024
Névtelen felsorolás	enum { BUFFER_SIZE = 1024 };
Változó , mint állandó	const int puffer_méret = 1024 ; extern const int puffer_size ;

A C nyelvben a konstansok meghatározásához a preprocesszor direktívával deklarált makródefiníciókat szokás használni [17] : #define

#define állandó név [ érték ]

Az így bevezetett konstans a konstans beállításától kezdve a programkód végéig, vagy amíg az adott konstans hatását a direktíva meg nem szünteti, hatókörében lesz érvényben #undef:

#undef állandó név

Mint minden makró esetében, egy elnevezett konstans esetén az állandó értéke automatikusan behelyettesítésre kerül a programkódban, ahol az állandó nevét használják. Emiatt egész vagy valós számok makrón belüli deklarálásakor szükség lehet az adattípus explicit megadására a megfelelő literális utótag használatával, ellenkező esetben a szám alapértelmezés szerint típust fog adni integész szám esetén, vagy típust egy típus double esetén. igazi.

Egész számok esetén van egy másik módszer is a névvel ellátott konstansok létrehozására – operátor-enum-okon keresztül enum[17] . Ez a módszer azonban csak a típusnál kisebb vagy azzal egyenlő típusokra alkalmas , és a szabványos könyvtárban nem használják [18] . int

A minősítővel is lehet állandókat változóként létrehozni const, de a másik két módszertől eltérően az ilyen állandók memóriát fogyasztanak, rá lehet mutatni, és fordítási időben nem használhatók [17] :

a bitmezők méretének megadásához,
egy tömb méretének beállítása (kivéve a változó hosszúságú tömböket),
egy felsorolási elem értékének beállításához,
mint az operátor értéke case.

Kulcsszavak

A kulcsszavak olyan azonosítók, amelyeket egy adott feladat elvégzésére terveztek a fordítási szakaszban, vagy tippeket és utasításokat adnak a fordítónak.

A C nyelv kulcsszavai [19]

Kulcsszavak	Célja	Alapértelmezett
sizeof	Egy objektum méretének lekérése fordítási időben	C89
typedef	Alternatív név megadása egy típushoz
auto,register	A fordítói tippek a változók tárolási helyére
extern	Megmondja a fordítónak, hogy az aktuális fájlon kívül keressen egy objektumot
static	Statikus objektum deklarálása
void	Nincs értékjelző; mutatókban tetszőleges adatot jelent
char... short_ int_long	Egész számtípusok és méretmódosítóik
signed,unsigned	Egész típusú módosítók, amelyek előjelesként vagy előjel nélküliként határozzák meg őket
float,double	Valódi adattípusok
const	Egy adattípus-módosító, amely közli a fordítóval, hogy az adott típusú változók csak olvashatók
volatile	A fordító utasítása egy változó értékének kívülről történő megváltoztatására
struct	Adattípus, mezőkészlettel rendelkező struktúraként megadva
enum	Egy adattípus, amely egész értékek halmazának egyikét tárolja
union	Olyan adattípus, amely különböző adattípusok reprezentációiban képes adatokat tárolni
do. for_while	Loop kijelentések
if,else	Feltételes operátor
switch. case_default	Operátor kiválasztása egész szám paraméter alapján
break,continue	Loop Break nyilatkozatok
goto	Feltétel nélküli ugrás operátor
return	Visszatérés egy függvényből
inline	Inline függvény deklaráció	C99 [20]
restrict	Olyan mutató deklarálása, amely egy olyan memóriablokkra hivatkozik, amelyre más mutató nem hivatkozik
_Bool[b]	logikai adattípus
_Complex[c] ,_Imaginary [d]	Komplex számszámításokhoz használt típusok
_Atomic	Típusmódosító, ami atomossá teszi	C11
_Alignas[e]	Explicit módon megadja a bájt igazítását egy adattípushoz
_Alignof[f]	Igazítás lekérése egy adott adattípushoz fordítási időben
_Generic	Egy értékkészlet kiválasztása fordítási időben, a vezérelt adattípus alapján
_Noreturn[g]	Jelzi a fordítónak, hogy a függvény nem fejeződhet be normálisan (azaz return)
_Static_assert[h]	A fordításkor ellenőrizendő állítások megadása
_Thread_local[én]	Egy szál-lokális változó deklarálása

Fenntartott azonosítók

A kulcsszavakon kívül a nyelvi szabvány lefoglalt azonosítókat határoz meg, amelyek használata a szabvány jövőbeni verzióival való összeférhetetlenséghez vezethet. A kulcsszó kivételével minden olyan szó, amely aláhúzással ( ) kezdődik, _amelyet nagybetű ( A- Z) vagy egy másik aláhúzás [21] követ, le van foglalva . A C99 és C11 szabványokban ezen azonosítók egy részét az új nyelvi kulcsszavakhoz használták.

A fájl hatókörében az aláhúzással ( _) [21] kezdődő nevek használata fenntartva , azaz megengedett típusok, konstansok és változók elnevezése egy utasításblokkon belül, például függvényeken belül, aláhúzással.

Fenntartott azonosítók a szabványos könyvtár összes makrója és a linkelési szakaszban hivatkozott nevek is [21] .

A lefoglalt azonosítók használatát a programokban a szabvány nem definiált viselkedésként határozza meg . Bármely szabványos makró törlésének kísérlete a viadalon #undefszintén meghatározatlan viselkedést eredményez [21] .

Megjegyzések

A C program szövege tartalmazhat olyan töredékeket, amelyek nem részei a programkódnak – megjegyzések . A megjegyzéseket speciális módon jelöljük a program szövegében, és az összeállítás során kihagyjuk.

Kezdetben a C89/* szabványban olyan soron belüli megjegyzések álltak rendelkezésre, amelyeket a karaktersorozatok és a karakterek közé lehetett helyezni */. Ebben az esetben nem lehet egyik megjegyzést a másikba beágyazni, mivel az első találkozási sorozat */befejezi a megjegyzést, és a jelölést közvetlenül követő szöveget */a fordító a program forráskódjaként fogja fel.

A következő szabvány, a C99 a megjegyzések megjelölésének egy újabb módját vezette be: megjegyzésnek egy karaktersorozattal //kezdődő és egy sor végére végződő szöveget tekintünk [20] .

A megjegyzéseket gyakran használják a forráskód öndokumentálására, bonyolult részek magyarázatára, bizonyos fájlok céljának leírására, valamint bizonyos függvények, makrók, adattípusok és változók használatának és működésének szabályainak leírására. Vannak olyan utófeldolgozók, amelyek a speciálisan formázott megjegyzéseket dokumentumokká alakíthatják. Az ilyen C nyelvű utófeldolgozók közül a Doxygen dokumentációs rendszer működhet .

Operátorok

A kifejezésekben használt operátorok olyan műveletek, amelyeket operandusokon hajtanak végre, és amelyek egy számított értéket adnak vissza - a művelet eredményét. Az operandus lehet konstans, változó, kifejezés vagy függvényhívás. Az operátor lehet speciális karakter, speciális karakterek halmaza vagy speciális szó. Az operátorokat az érintett operandusok száma különbözteti meg, nevezetesen megkülönböztetnek unáris, bináris és hármas operátorokat.

Unáris operátorok

Az unáris operátorok egyetlen argumentumon hajtanak végre műveletet, és a következő műveleti formátummal rendelkeznek:

[ operátor ] [ operandus ]

A postfix növelési és csökkentési műveletek fordított formátumúak:

[ operandus ] [ operátor ] Unary C operátorok [22]

+	egységes plusz	~	A visszatérési kód felvétele	&	Cím felvétele	++	Előtag vagy utótag növekménye	sizeof	A memóriában lévő objektum által elfoglalt bájtok számának lekérése; műveletként és operátorként is használható
-	egységes mínusz	!	logikai tagadás	*	Mutató dereferálása	--	Előtag vagy utótag csökkentése	_Alignof	Igazítás lekérése egy adott adattípushoz

A növelő és csökkentő operátorok, ellentétben a többi unáris operátorral, megváltoztatják operandusuk értékét. Az előtag operátor először módosítja az értéket, majd visszaadja azt. A Postfix először visszaadja az értéket, és csak azután módosítja azt.

Bináris operátorok

A bináris operátorok két argumentum között helyezkednek el, és műveletet hajtanak végre rajtuk:

[ operandus ] [ operátor ] [ operandus ] Alapvető bináris operátorok [23]

+	Kiegészítés	%	A hadosztály fennmaradó részét elvéve	<<	Bitenkénti bal eltolás	>	Több	==	Egyenlő
-	Kivonás	&	Bitenként ÉS	>>	Bit eltolás jobbra	<	Kevésbé	!=	Nem egyenlő
*	Szorzás	\|	Bitenkénti VAGY	&&	logikus ÉS	>=	Nagyobb vagy egyenlő
/	Osztály	^	Bitenkénti XOR	\|\|	Logikus VAGY	<=	Kisebb vagy egyenlő

Ezenkívül a C bináris operátorai közé tartoznak a bal oldali hozzárendelési operátorok is, amelyek a bal és a jobb oldali argumentumokra hajtanak végre műveletet, és az eredményt a bal oldali argumentumba helyezik.

Balra hozzárendelt bináris operátorok [24]

=	A jobb oldali argumentum értékének hozzárendelése a balhoz	%=	A bal oldali operandus jobbdal való osztásának maradéka	^=	A jobb oldali operandus bitenkénti XOR-ja a bal operandushoz
+=	Hozzáadás a jobb oldal bal operandusához	/=	A bal oldali operandus felosztása a jobb oldalival	<<=	A bal oldali operandus bitenkénti eltolása balra a jobb oldali operandus által megadott bitek számával
-=	Kivonás a jobb bal oldali operandusából	&=	Bitenként ÉS a jobb oldali operandus balra	>>=	A bal oldali operandus bitenkénti eltolása jobbra a jobb oldali operandus által meghatározott bitszámmal
*=	A bal oldali operandus szorzása a jobb oldalival	\|=	A jobb oldali operandus bitenkénti VAGY balra

Ternáris operátorok

C-ben csak egy háromtagú operátor van, a rövidített feltételes operátor, amelynek a következő alakja van:

[ feltétel ] ?[ kifejezés1 ] :[ kifejezés2 ]

A gyorsított feltételes operátornak három operandusa van:

[ feltétel ] - egy logikai feltétel, amely ellenőrzi az igazságot,
[ kifejezés1 ] - kifejezés, amelynek értéke a művelet eredményeként kerül visszaadásra, ha a feltétel igaz;
A [ kifejezés2 ] az a kifejezés, amelynek értéke hamis feltétel esetén a művelet eredményeként kerül visszaadásra.

Az operátor ebben az esetben a jelek ?és a kombinációja :.

Kifejezések

A kifejezés konstansokon, változókon és függvényeken végzett műveletek rendezett halmaza. A kifejezések operandusokból és operátorokból álló műveleteket tartalmaznak . A műveletek végrehajtásának sorrendje a rögzítési formától és a műveletek prioritásától függ. Minden kifejezésnek van értéke - a kifejezésben szereplő összes művelet végrehajtásának eredménye. Egy kifejezés kiértékelése során a műveletek függvényében a változók értéke változhat, illetve függvények is végrehajthatók, ha a kifejezésben a hívásaik szerepelnek.

A kifejezések között megkülönböztethető a balra megengedett kifejezések osztálya - olyan kifejezések, amelyek a hozzárendelési jeltől balra jelenhetnek meg.

A műveletek végrehajtásának prioritása

A műveletek prioritását a szabvány határozza meg, és meghatározza a műveletek végrehajtásának sorrendjét. A műveletek C-ben az alábbi [25] [26] sorrendi táblázat szerint történnek .

Prioritás	zsetonok	Művelet	Osztály	Az asszociativitás
egy	a[index]	Hivatkozás index szerint	postfix	balról jobbra →
	f(érvek)	Funkcióhívás
	.	Field Access
	->	Mezőhozzáférés mutató segítségével
	++ --	Pozitív és negatív növekedés
	(típusnév ) {inicializáló}	Összetett literál (C99)
	(típusnév ) {inicializáló,}	Összetett literál (C99)
2	++ --	Pozitív és negatív előtag növekmény	egységes	← jobbról balra
	sizeof	A méret megszerzése
	_Alignof[f]	Igazítás lekérése ( C11 )
	~	Bitenként NEM
	!	Logikus NEM
	- +	Jeljelzés (mínusz vagy plusz)
	&	Cím megszerzése
	*	Mutatóhivatkozás (hivatkozás visszavonása)
	(típusnév)	Típusöntés
3	* / %	Szorzás, osztás és maradék	bináris	balról jobbra →
négy	+ -	Összeadás és kivonás
5	<< >>	Váltás balra és jobbra
6	< > <= >=	Összehasonlító műveletek
7	== !=	Az egyenlőség vagy egyenlőtlenség ellenőrzése
nyolc	&	Bitenként ÉS
9	^	Bitenkénti XOR
tíz	\|	Bitenkénti VAGY
tizenegy	&&	logikus ÉS
12	\|\|	Logikus VAGY
13	? :	Állapot	hármas	← jobbról balra
tizennégy	=	Érték hozzárendelés	bináris
tizennégy	+= -= *= /= %= <<= >>= &= ^= \|=	Műveletek a bal oldali érték megváltoztatására
tizenöt	,	Szekvenciális számítás		balról jobbra →

A kezelői prioritások C-ben nem mindig igazolják magukat, és néha intuitív módon nehezen megjósolható eredményekhez vezetnek. Például, mivel az unáris operátorok jobbról balra irányú asszociativitással rendelkeznek, a kifejezés kiértékelése a mutatónövekedést *p++eredményezi, amelyet egy hivatkozás ( *(p++)) követ, nem pedig a mutató növekedését ( (*p)++). Ezért a nehezen érthető helyzetekben javasolt a kifejezéseket kifejezetten zárójelek használatával csoportosítani [26] .

A C nyelv másik fontos jellemzője, hogy a függvényhívásnak átadott argumentumértékek kiértékelése nem szekvenciális [27] , vagyis az argumentumokat vesszővel elválasztó nem felel meg a szekvenciális kiértékelésnek a precedenciatáblázatból. A következő példában egy másik függvény argumentumaként megadott függvényhívások tetszőleges sorrendben lehetnek:

int x ; x = számítás ( get_arg1 (), get_arg2 ()); // először hívja meg a get_arg2() függvényt

A kifejezés kiértékelése során fellépő mellékhatások esetén sem hagyatkozhat a műveletek elsőbbségére , mivel ez definiálatlan viselkedéshez vezet [27] .

Sorozatpontok és mellékhatások

A nyelvi szabvány C függeléke meghatározza a szekvenciapontok halmazát , amelyek garantáltan nem okoznak folyamatos mellékhatásokat a számításokból. Azaz a szekvenciapont a számítások olyan szakasza, amely a kifejezések kiértékelését szétválasztja egymás között úgy, hogy a szekvenciapont előtt történt számítások, beleértve a mellékhatásokat is, már befejeződtek, a szekvenciapont után pedig még nem kezdődtek el [28 ] . Mellékhatás lehet egy változó értékének változása egy kifejezés kiértékelése során. A számításba bevont érték megváltoztatása, valamint annak mellékhatása, hogy ugyanazt az értéket a következő sorozatpontra változtatja, meghatározatlan viselkedéshez vezet. Ugyanez történik, ha a számításban ugyanannak az értéknek két vagy több oldalsó változása van [27] .

A szabvány által meghatározott szekvenciapontok [27]

Útpont	Esemény előtt	Esemény után
Funkcióhívás	Mutató kiszámítása egy függvényre és argumentumaira	Funkcióhívás
Logikai ÉS operátorok ( &&), VAGY ( \|\|) és szekvenciális számítások ( ,)	Az első operandus kiszámítása	A második operandus számítása
Gyorsírási feltétel operátor ( ?:)	A feltételként szolgáló operandus számítása	A 2. vagy 3. operandus kiszámítása
Két teljes kifejezés között (nem beágyazott)	Egy teljes kifejezés	A következő teljes kifejezés
Elkészült a teljes leíró
Közvetlenül a könyvtári funkcióból való visszatérés előtt
Minden egyes formázott I/O specifikátorhoz társított átalakítás után
Közvetlenül az összehasonlító függvény minden egyes hívása előtt és után, valamint az összehasonlító függvény hívása és az összehasonlító függvénynek átadott argumentumokkal végzett mozgások között

A teljes kifejezések a következők : [27] :

egy inicializáló, amely nem része egy összetett literálnak;
izolált kifejezés;
feltételes utasítás ( if) vagy kiválasztási utasítás ( switch) feltételeként megadott kifejezés;
ciklusfeltételként megadott kifejezés whileelő- vagy utófeltétellel;
minden ciklusparaméter for, ha van ilyen;
operátor kifejezés return, ha van megadva.

A következő példában a változó háromszor megváltozik a sorozatpontok között, ami meghatározatlan eredményt eredményez:

int i = 1 ; // A leíró az első sorozatpont, a teljes kifejezés a második i += ++ i + 1 ; // Teljes kifejezés - harmadik sorozatpont printf ( "%d \n " , i ); // 4-et vagy 5-öt is kiadhat

További egyszerű példák az elkerülendő, meghatározatlan viselkedésre:

i = i ++ + 1 ; // meghatározatlan viselkedés i = ++ i + 1 ; // szintén meghatározatlan viselkedés printf ( "%d, %d \n " , -- i , ++ i ); // meghatározatlan viselkedés printf ( "%d, %d \n " , ++ i , ++ i ); // szintén meghatározatlan viselkedés printf ( "%d, %d \n " , i = 0 , i = 1 ); // meghatározatlan viselkedés printf ( "%d, %d \n " , i = 0 , i = 0 ); // szintén meghatározatlan viselkedés a [ i ] = i ++ ; // meghatározatlan viselkedés a [ i ++ ] = i ; // szintén meghatározatlan viselkedés

Ellenőrző utasítások

A vezérlő utasítások műveletek végrehajtására és a programvégrehajtás folyamatának szabályozására szolgálnak. Több egymást követő utasítás állítássorozatot alkot .

Üres nyilatkozat

A legegyszerűbb nyelvi konstrukció egy üres kifejezés, amelyet üres utasításnak neveznek [29] :

;

Az üres utasítás nem tesz semmit, és bárhol elhelyezhető a programban. Gyakran használják a hiányzó törzsű hurkokban [30] .

Útmutató

Az utasítás egyfajta elemi művelet:

( kifejezés );

Ennek az operátornak az a feladata, hogy végrehajtsa az operátor törzsében megadott kifejezést.

Több egymást követő utasítás egy utasítássorozatot alkot .

Utasítás blokk

Az utasítások a következő formájú speciális blokkokba csoportosíthatók:

{

( utasítások sorozata )

Az állítások blokkját, amelyet néha összetett utasításnak is neveznek, egy bal oldali kapcsos zárójel ( {) az elején és egy jobb oldali kapcsos zárójel ( }) a végén határolja.

A függvényekben egy utasításblokk a függvény törzsét jelöli, és a függvénydefiníció része. Az összetett utasítás ciklus-, feltétel- és választási utasításokban is használható.

Feltételes állítások

Két feltételes operátor van a nyelvben, amelyek programelágazást valósítanak meg:

ifegyetlen feltételtesztet tartalmazó nyilatkozat ,
és egy switchtöbb ellenőrizendő feltételt tartalmazó nyilatkozat.

Az operátor legegyszerűbb formájaif

if(( feltétel ) )( operátor ) ( következő kijelentés )

Az operátor ifa következőképpen működik:

ha a zárójelben lévő feltétel igaz, akkor az első utasítás, majd az azt követő utasítás végrehajtásra kerül if.
ha a zárójelben megadott feltétel nem teljesül, akkor az utasítás után megadott utasítás azonnal végrehajtódik if.

Különösen a következő kód, ha a megadott feltétel teljesül, nem hajt végre semmilyen műveletet, mivel valójában egy üres utasítás kerül végrehajtásra:

if(( állapot )) ;

Az operátor összetettebb formája ifa kulcsszót tartalmazza else:

if(( feltétel ) )( operátor ) else( alternatív operátor ) ( következő kijelentés )

Itt, ha a zárójelben megadott feltétel nem teljesül, akkor a kulcsszó után megadott utasítás végrehajtásra kerül else.

Annak ellenére, hogy a szabvány lehetővé teszi az utasítások egy sorban ifvagy elseegyetlen sorban történő megadását, ez rossz stílusnak minősül, és csökkenti a kód olvashatóságát. Javasoljuk, hogy mindig kapcsos kapcsos zárójeleket használva adjon meg egy utasításblokkot [31] .

Cikkvégrehajtási utasítások

A ciklus egy kódrészlet, amely tartalmazza

hurokvégrehajtási feltétel – állandóan ellenőrzött feltétel;
a ciklustörzs pedig egy egyszerű vagy összetett utasítás, amelynek végrehajtása a ciklus állapotától függ.

Ennek megfelelően kétféle ciklus létezik:

előfeltételű hurok , ahol először a ciklusvégrehajtási feltételt ellenőrizzük, és ha a feltétel teljesül, akkor a ciklustörzs végrehajtásra kerül;
egy utófeltételes hurok , ahol a huroktörzs végrehajtása után a ciklusfolytatási feltételt ellenőrizzük.

A feltételes ciklus garantálja, hogy a ciklus törzse legalább egyszer végrehajtásra kerül.

A C nyelv két ciklusváltozatot biztosít előfeltétellel: whileés for.

while(állapot) [ huroktest ] for( inicializálási blokkfeltétel ;utasítás ;[) loop body ],

A ciklust forparametrikusnak is nevezik, ez ekvivalens a következő utasításblokkkal:

[ inicializálási blokk ] while(állapot) { [ huroktest ] [ operátor ] }

Normál helyzetben az inicializálási blokk tartalmazza egy változó kezdeti értékének beállítását, amelyet hurokváltozónak nevezünk, és az utasítás, amely közvetlenül azután fut le, hogy a ciklustörzs megváltoztatja a használt változó értékét, a feltétel tartalmazza a használt ciklusváltozó értékének összehasonlítása valamilyen előre meghatározott értékkel, és amint az összehasonlítás leáll, a ciklus megszakad, és a ciklus utasítást közvetlenül követő programkód végrehajtása megkezdődik.

A ciklus do-whileesetén a feltétel a ciklus törzse után van megadva:

do[ huroktest ] while( állapot)

A ciklusfeltétel egy logikai kifejezés. Az implicit típusú öntvény azonban lehetővé teszi számtani kifejezések ciklusfeltételként történő használatát. Ez lehetővé teszi az úgynevezett "végtelen hurok" megszervezését:

while(1);

Ugyanezt megtehetjük az operátorral is for:

for(;;);

A gyakorlatban az ilyen végtelen hurkokat általában a break, gotovagy a -val együtt használják return, amelyek különböző módon szakítják meg a hurkot.

A feltételes utasításokhoz hasonlóan, ha egysoros törzset kapcsos kapcsos zárójeles utasításblokkba nem zárunk, az rossz stílusnak minősül, ami csökkenti a kód olvashatóságát [31] .

Feltétel nélküli ugrás operátorok

A feltétel nélküli elágazási operátorok lehetővé teszik, hogy megszakítsa a számítások bármely blokkjának végrehajtását, és az aktuális függvényen belül egy másik helyre lépjen a programban. A feltétel nélküli ugrás operátorokat általában feltételes operátorokkal együtt használják.

goto[ címke ],

A címke egy olyan azonosító, amely átadja az irányítást a programban a megadott címkével megjelölt operátornak:

[ címke ] :[ operátor ]

Ha a megadott címke nem szerepel a programban, vagy ha több utasítás van ugyanazzal a címkével, a fordító hibát jelez.

A vezérlés átadása csak azon a funkción belül lehetséges, ahol az átmeneti operátort használjuk, ezért az operátor gotohasználatával nem lehet átvinni a vezérlést egy másik funkcióra.

Más ugrási utasítások ciklusokhoz kapcsolódnak, és lehetővé teszik a ciklustörzs végrehajtásának megszakítását:

az utasítás breakazonnal megszakítja a ciklustörzs végrehajtását, és a vezérlés átkerül a ciklust közvetlenül követő utasításra;
az operátor continuemegszakítja a ciklus aktuális iterációjának végrehajtását, és kísérletet kezdeményez a következőre.

Az utasítás breakmegszakíthatja az utasítás működését is , így a ciklusban futó switchutasításon belül az utasítás nem tudja megszakítani a ciklust. A ciklus törzsében megadva megszakítja a legközelebbi beágyazott ciklus munkáját. switchbreak

Az operátor continuecsak a do, whileés operátorokon belül használható for. A hurkok whileés do-whileaz operátor continueesetén a ciklusfeltétel tesztelését, hurok esetén pedig a ciklus for 3. paraméterében megadott operátor végrehajtását okozza, a ciklus folytatásának feltételének ellenőrzése előtt.

Függvényvisszaadási utasítás

Az operátor returnmegszakítja annak a funkciónak a végrehajtását, amelyben használják. Ha a függvénynek nem kell értéket adnia, akkor visszatérési érték nélküli hívást használunk:

return;

Ha a függvénynek értéket kell visszaadnia, akkor a visszatérési érték az operátor után jelenik meg:

return[ érték ];

Ha a függvénytörzsben a return utasítás után van más utasítás, akkor ezek az utasítások soha nem fognak végrehajtódni, ilyenkor a fordító figyelmeztetést adhat ki. Az operátor után azonban returnfel lehet tüntetni a funkció alternatív, például tévedésből történő leállítására vonatkozó utasításokat, és az ezekre az operátorokra való áttérés az operátor segítségével gototetszőleges feltételek mellett végrehajtható .

Változók

Egy változó deklarálásakor megadjuk a típusát és a nevét, valamint a kezdőértéket is megadhatjuk:

[leíró] [név];

vagy

[descriptor] [name] =[initializer] ;,

ahol

[descriptor] - változó típusa és a típust megelőző opcionális módosítók;
[név] – változó neve;
[inicializáló] – a létrehozásakor hozzárendelt változó kezdeti értéke.

Ha a változóhoz nincs hozzárendelve kezdeti érték, akkor globális változó esetén az értéke nullákkal lesz kitöltve, lokális változó esetén pedig a kezdeti érték definiálatlan lesz.

A változóleíróban a változót globálisként jelölheti meg, de csak egy fájl vagy függvény hatókörére korlátozódik a kulcsszó használatával static. Ha egy változót a kulcsszó nélkül deklarálunk globálisnak static, akkor más fájlokból is elérhető, ahol ezt a változót inicializáló nélkül, de a kulcsszóval kell deklarálni extern. Az ilyen változók címét a kapcsolat időpontjában határozzák meg .

Funkciók

A függvény egy független programkód, amely újra felhasználható egy programban. A függvények argumentumokat vehetnek fel, és értékeket adhatnak vissza. A függvényeknek mellékhatásai is lehetnek végrehajtásuk során: globális változók megváltoztatása, fájlokkal való munka, interakció az operációs rendszerrel vagy hardverrel [28] .

Egy függvény C-ben való meghatározásához deklarálnia kell:

jelentse a funkció nevét (azonosítóját),
bemeneti paraméterek listája (argumentumok)
és adja meg a visszatérési típust.

Szükséges továbbá egy függvénydefiníció megadása, amely a függvény viselkedését megvalósító utasítások blokkját tartalmazza.

Egy adott függvény nem deklarálása hiba, ha a függvényt a definíción kívül használják, ami a megvalósítástól függően üzeneteket vagy figyelmeztetéseket eredményez.

Egy függvény meghívásához elegendő a nevét megadni a zárójelben megadott paraméterekkel. Ilyenkor a híváspont címe kerül a verembe, létrejönnek és inicializálódnak a függvényparaméterekért felelős változók, és a vezérlés átkerül a hívott függvényt megvalósító kódra. A függvény végrehajtása után a függvényhívás során lefoglalt memória felszabadul, a hívási ponthoz való visszatérés, és ha a függvényhívás valamilyen kifejezés része, a függvényen belül számított érték átkerül a visszatérési pontba.

Ha a függvény után nincs megadva zárójel, akkor a fordító ezt úgy értelmezi, hogy megkapja a függvény címét. Egy függvény címe beírható egy pointerbe, majd a függvényt egy rámutató mutató segítségével hívhatjuk meg, amit például a plugin rendszerekben aktívan használnak [32] .

A kulcsszó inlinesegítségével megjelölheti azokat a függvényeket, amelyek hívását a lehető leggyorsabban szeretné végrehajtani. A fordító az ilyen függvények kódját közvetlenül a hívásuk pontján helyettesítheti [33] . Ez egyrészt növeli a végrehajtható kód mennyiségét, másrészt viszont a végrehajtás idejét takarítja meg, mivel az időigényes függvényhívási műveletet nem használjuk. A számítógépek architektúrája miatt azonban a beágyazó funkciók felgyorsíthatják vagy lelassíthatják az alkalmazás egészét. Azonban sok esetben az inline függvények a legelőnyösebb helyettesítő makrók [34] .

Funkció deklaráció

A függvénydeklaráció a következő formátumú:

[leíró] [név] ([lista] );,

ahol

[descriptor] – a függvény által visszaadott érték típusleírója;
[név] - függvény neve (a függvény egyedi azonosítója);
[lista] - a függvény (formális) paramétereinek listája vagy voidezek hiányában [35] .

A függvénydeklaráció előjele a „ ;” szimbólum, tehát a függvénydeklaráció egy utasítás.

A legegyszerűbb esetben a [declarator] egy adott típusú visszatérési érték jelzését tartalmazza. Az olyan függvény, amely nem adhat vissza semmilyen értéket, típusúnak van deklarálva void.

Ha szükséges, a leíró kulcsszavakkal meghatározott módosítókat tartalmazhat:

externazt jelzi, hogy a függvénydefiníció egy másik modulban van ;
staticegy statikus függvényt határoz meg, amely csak az aktuális modulban használható.

A függvényparaméterek listája határozza meg a függvény aláírását.

A C nem teszi lehetővé több, azonos nevű függvény deklarálását, a függvénytúlterhelés nem támogatott [36] .

Függvénydefiníció

A függvénydefiníció a következő formátumú:

[leíró] [név] ([lista] )[test]

Ahol [deklarátor], [név] és [lista] megegyezik a deklarációban szereplővel, a [test] pedig egy összetett utasítás, amely a függvény konkrét megvalósítását képviseli. A fordító az azonos nevű függvények definícióit aláírásukkal különbözteti meg, és így (aláírással) kapcsolat jön létre a definíció és a megfelelő deklaráció között.

A függvény törzse így néz ki:

{ [kijelentéssorozat] return([visszatérési érték]); }

A függvényből való visszatérés a operátor segítségével történik , amely a függvény által visszaadott adattípustól függően vagy megadja a visszatérési értéket, vagy nem adja meg. Ritka esetekben előfordulhat, hogy egy függvény fejlécfájlból származó makró használatával nem hoz vissza eredményt , ebben az esetben nincs szükség utasításra. Például az önmagukban feltétel nélkül meghívó függvények jelölhetők így [33] . returnnoreturnstdnoreturn.hreturnabort()

Függvényhívás

A függvényhívás a következő műveleteket hajtja végre:

a hívópont mentése a verembe;
automatikus memóriafoglalás a függvény formális paramétereinek megfelelő változókhoz;
a változók inicializálása a függvénynek átadott változók értékeivel (a függvény tényleges paraméterei) a függvény meghívásakor, valamint azon változók inicializálása, amelyekre a függvény deklarációjában az alapértelmezett értékek vannak megadva, de amelyekre a hívás során nem adták meg a hozzájuk tartozó tényleges paramétereket;
az irányítás átadása a funkció törzsének.

Az implementációtól függően a fordító vagy szigorúan gondoskodik arról, hogy az aktuális paraméter típusa megegyezzen a formális paraméter típusával, vagy ha lehetséges, implicit típuskonverziót hajt végre, ami nyilvánvalóan mellékhatásokhoz vezet.

Ha egy változót adunk át a függvénynek, akkor a függvény meghívásakor másolat jön létre róla ( memória lefoglalásra kerül a veremben , és az értéket másoljuk). Például, ha egy struktúrát egy függvénynek adunk át, akkor a teljes struktúra másolásra kerül. Ha egy struktúrára mutató mutatót adunk át, akkor csak a mutató értéke kerül másolásra. Egy tömb függvénynek való átadása is csak az első elemre mutató mutatót másolja. Ebben az esetben annak kifejezett jelzésére, hogy a tömb elejének címét veszi be a függvény bemeneteként, nem pedig egyetlen változóra mutató mutatót, ahelyett, hogy a változó neve után mutatót deklarálna, szögletes zárójeleket tehet, pl. példa:

void example_func ( int tömb []); A // tömb egy int típusú tömb első elemére mutató mutató

C engedélyezi a beágyazott hívásokat. A hívások egymásba ágyazási mélysége nyilvánvalóan korlátozza a programhoz rendelt verem méretét. Ezért a C implementációk korlátot szabnak a beágyazás mélységének.

A beágyazott hívás speciális esete egy függvényhívás a meghívott függvény törzsében. Az ilyen hívást rekurzívnak nevezik, és egységes számítások szervezésére szolgál. Tekintettel a beágyazott hívásokra vonatkozó természetes korlátozásra, a rekurzív megvalósítást felváltja a hurkokat használó megvalósítás.

Adattípusok

Primitív típusok

Egész számok

Az egész adattípusok mérete legalább 8 és legalább 32 bit között van. A C99 szabvány az egész szám maximális méretét legalább 64 bitre növeli. Az egész adattípusok egész számok tárolására szolgálnak (a típus charaz ASCII karakterek tárolására is szolgál). Az alábbi adattípusok minden tartománymérete minimális, és adott platformon nagyobb is lehet [37] .

A szabvány a típusok minimális méretéből adódóan megköveteli, hogy az integrált típusok méretei teljesítsék a következő feltételt:

1= ≤ ≤ ≤ ≤ . sizeof(char)sizeof(short)sizeof(int)sizeof(long)sizeof(long long)

Így egyes típusok mérete a bájtok számát tekintve megegyezhet, ha teljesül a minimális bitszám feltétele. Akár charés longazonos méretű is lehet, ha egy bájt 32 bitet vagy többet vesz igénybe, de az ilyen platformok nagyon ritkák vagy nem léteznek. A szabvány garantálja, hogy a típus char mindig 1 bájtos. A bájt bitben kifejezett méretét CHAR_BITa fejlécfájlban lévő állandó határozza meg limits.h, amely POSIX -kompatibilis rendszereken 8 bit [38] .

Az egész típusok szabvány szerinti minimális értéktartománya előjeles típusoknál tól -ig , előjel nélküli típusoknál pedig -tól -ig van meghatározva , ahol N a típus bitmélysége. A fordítóprogramok saját belátásuk szerint bővíthetik ezt a tartományt. A gyakorlatban a -tól -ig terjedő tartományt gyakrabban használják az aláírt típusoknál . Az egyes típusok minimális és maximális értékei a fájlban makródefiníciókként vannak megadva. -(2N-1-1)2N-1-102N-2N-12N-1-1limits.h

Különös figyelmet kell fordítani a típusra char. Formálisan ez egy külön típus, de valójában charegyenértékű a signed char, vagy unsigned char-vel, a fordítótól függően [39] .

A típusméretek összetévesztésének elkerülése érdekében a C99 szabvány új adattípusokat vezetett be, amelyeket a stdint.h. Ezek között vannak olyan típusok, mint: , , , ahol = 8, 16, 32 vagy 64. Az előtag a bitek befogadására alkalmas minimális típust jelöli, az előtag pedig egy legalább 16 bites típust, amely a leggyorsabb ezen a platformon. Az előtag nélküli típusok rögzített bitméretű típusokat jelölnek. intN_tint_leastN_tint_fastN_tNleast-Nfast-N

least-Az és előtagú típusok a , , fast-típusok helyettesítőjének tekinthetők , azzal az egyetlen különbséggel, hogy az előbbiek a programozó számára lehetőséget adnak a sebesség és a méret között. intshortlong

Alapvető adattípusok egész számok tárolására

Adattípus	A méret	Minimális értéktartomány	Alapértelmezett
signed char	minimum 8 bit	-127-ről [40] (= -(2 7 -1)) 127-re	C90 [j]
int_least8_t			C99
int_fast8_t			C99
unsigned char	minimum 8 bit	0-tól 255-ig (=2 8-1 )	C90 [j]
uint_least8_t			C99
uint_fast8_t			C99
char	minimum 8 bit	−127 és 127 között vagy 0 és 255 között a fordítótól függően	C90 [j]
short int	minimum 16 bit	-32,767-ről (= -(2 15 -1)) 32,767-re	C90 [j]
int			C90 [j]
int_least16_t			C99
int_fast16_t			C99
unsigned short int	minimum 16 bit	0 - 65,535 (= 2 16 -1)	C90 [j]
unsigned int			C90 [j]
uint_least16_t			C99
uint_fast16_t			C99
long int	minimum 32 bit	−2 147 483 647 és 2 147 483 647 között	C90 [j]
int_least32_t			C99
int_fast32_t			C99
unsigned long int	minimum 32 bit	0 - 4 294 967 295 (= 2 32 -1)	C90 [j]
uint_least32_t			C99
uint_fast32_t			C99
long long int	minimum 64 bit	-9,223,372,036,854,775,807 - 9,223,372,036,854,775,807	C99
int_least64_t
int_fast64_t
unsigned long long int	minimum 64 bit	0 - 18 446 744 073 709 551 615 (= 264 -1 )
uint_least64_t
uint_fast64_t
int8_t	8 bites	-127-től 127-ig
uint8_t	8 bites	0-tól 255-ig (=2 8-1 )
int16_t	16 bites	-32,767 és 32,767 között
uint16_t	16 bites	0 - 65,535 (= 2 16 -1)
int32_t	32 bites	−2 147 483 647 és 2 147 483 647 között
uint32_t	32 bites	0 - 4 294 967 295 (= 2 32 -1)
int64_t	64 bites	-9,223,372,036,854,775,807 - 9,223,372,036,854,775,807
uint64_t	64 bites	0 - 18 446 744 073 709 551 615 (= 264 -1 )
A táblázat a nyelvi szabvány szerinti minimális értéktartományt mutatja. A C fordítók bővíthetik az értéktartományt.

Kiegészítő egész típusok

Ezenkívül a C99 szabvány óta a intmax_tés típusok hozzáadásra kerültek uintmax_t, amelyek a legnagyobb aláírt és előjel nélküli típusoknak felelnek meg. Ezek a típusok kényelmesek, ha makrókban használják köztes vagy ideiglenes értékek tárolására az egész argumentumokkal végzett műveletek során, mivel lehetővé teszik bármilyen típusú érték illesztését. Például ezeket a típusokat használják a C Check unit testing library egész számok összehasonlító makróiban [41] .

A C-ben számos további egész típus létezik a mutató adattípusának biztonságos kezeléséhez: intptr_t, uintptr_tés ptrdiff_t. intptr_tA C99 szabvány és típusai uintptr_telőjeles és előjel nélküli értékek tárolására szolgálnak, amelyek méretükben elférnek egy mutatóban. Ezeket a típusokat gyakran használják tetszőleges egész számok mutatóban való tárolására, például annak érdekében, hogy megszabaduljanak a szükségtelen memóriafoglalástól a visszacsatolási függvények regisztrálásakor [42] , vagy amikor harmadik féltől származó linkelt listákat, asszociatív tömböket és más olyan struktúrákat használnak, amelyekben az adatokat mutató tárolja. ptrdiff_tA fejlécfájl típusát stddef.húgy tervezték, hogy biztonságosan tárolja két mutató különbségét.

A méret tárolásához a size_tfejlécfájl előjel nélküli típusát biztosítjuk stddef.h. Ez a típus a mutatónál elérhető maximális számú bájt tárolására képes, és jellemzően a méret bájtokban történő tárolására szolgál. Ennek a típusnak az értékét adja vissza az operátor sizeof[43] .

Integer típusú öntés

Az egész típusú konverzió történhet explicit módon, cast operátor használatával vagy implicit módon. A -nál kisebb típusú értékek int, ha bármilyen műveletben vesznek részt, vagy függvényhívásnak adják át, automatikusan a típusba kerülnek int, és ha az átalakítás nem lehetséges, akkor a típusba unsigned int. Az ilyen implicit öntvények gyakran szükségesek ahhoz, hogy a számítás eredménye helyes legyen, de néha intuitív módon érthetetlen hibákhoz vezetnek a számításokban. Például, ha a műveletben a és típusú számok szerepelnek int, unsigned intés az előjeles érték negatív, akkor egy negatív szám előjel nélküli típusra konvertálása túlcsorduláshoz és nagyon nagy pozitív értékhez vezet, ami az összehasonlítási műveletek helytelen eredményéhez vezethet. [44] .

Helyes és helytelen automata típusú öntés összehasonlítása

Az aláírt és előjel nélküli típusok kisebbek, mintint	Az aláírt kevesebb, mint az aláíratlan, és az aláíratlan nem kevesebbint
#include <stdio.h> előjeles karakter x = -1 ; előjel nélküli char y = 0 ; if ( x > y ) { // feltétel false printf ( "Az üzenet nem jelenik meg. \n " ); } if ( x == UCHAR_MAX ) { // feltétel false printf ( "Az üzenet nem jelenik meg. \n " ); }	#include <stdio.h> előjeles karakter x = -1 ; előjel nélküli int y = 0 ; if ( x > y ) { // feltétel igaz printf ( "Túlcsordulás az x változóban. \n " ); } if (( x == UINT_MAX ) && ( x == ULONG_MAX )) { // feltétel mindig igaz lesz printf ( "Túlcsordulás az x változóban. \n " ); }
Ebben a példában mindkét típus, az aláírt és az aláíratlan, az aláírt fájlba lesz átküldve int, mert lehetővé teszi mindkét típus tartományának illeszkedését. Ezért a feltételes operátor összehasonlítása helyes lesz.	Az előjeles típus előjel nélküli típusba kerül, mert az előjel nélküli típus mérete nagyobb vagy egyenlő, mint a int, de túlcsordulás történik, mert lehetetlen negatív értéket megjeleníteni egy előjel nélküli típusban.

Az automatikus típus-öntés akkor is működik, ha a kifejezésben két vagy több különböző egész szám szerepel. A szabvány meghatároz egy szabályrendszert, amely szerint olyan típuskonverziót választanak ki, amely a számítás helyes eredményét tudja adni. A különböző típusokhoz különböző rangokat rendelnek az átalakításon belül, és maguk a rangok a típus méretétől függenek. Ha egy kifejezésben különböző típusok vesznek részt, általában úgy döntenek, hogy ezeket az értékeket egy magasabb rangú típusba öntjük [44] .

Valós számok

A C-ben lévő lebegőpontos számokat három alapvető típus képviseli: float, doubleés long double.

A valós számok ábrázolása nagyon különbözik az egész számoktól. A különböző típusú valós számok tizedes jelöléssel írt állandói nem feltétlenül egyenlőek egymással. Például a feltétel 0.1 == 0.1fhamis lesz a típus pontosságának elvesztése miatt float, míg a feltétel 0.5 == 0.5figaz lesz, mert ezek a számok végesek a bináris ábrázolásban. Azonban az öntési feltétel (float) 0.1 == 0.1fis igaz lesz, mert egy kevésbé pontos típusra öntve elvesznek azok a bitek, amelyek a két állandót eltérnek egymástól.

A valós számokkal végzett aritmetikai műveletek szintén pontatlanok, és gyakran előfordulnak valamilyen lebegő hibájuk [45] . A legnagyobb hiba akkor fordul elő, ha olyan értékekkel dolgozik, amelyek közel állnak egy adott típusnál lehetséges minimumhoz. Ezenkívül a hiba nagynak bizonyulhat, ha egyidejűleg nagyon kicsi (≪ 1) és nagyon nagy számok (≫ 1) felett számítunk. Egyes esetekben a hiba csökkenthető az algoritmusok és számítási módszerek megváltoztatásával. Például, ha a többszörös összeadást szorzással helyettesíti, a hiba annyiszor csökkenhet, ahányszor eredetileg összeadási műveletek voltak.

Szintén a fejlécfájlban math.htalálható két további típus float_tés double_t, amelyek legalább a floatés típusoknak doublemegfelelnek, de eltérhetnek tőlük. float_tA és típusok double_ta C99 szabványban szerepelnek , az alaptípusokhoz való megfelelésüket a makró értéke határozza meg FLT_EVAL_METHOD.

Valódi adattípusok

Adattípus	A méret	Alapértelmezett
float	32 bites	IEC 60559 ( IEEE 754 ), a C szabvány F kiterjesztése [46] [k] , egyetlen precíziós szám
double	64 bites	IEC 60559 (IEEE 754), a C szabvány F kiterjesztése [46] [k] , kettős precíziós szám
long double	minimum 64 bit	megvalósítás függő
float_t(C99)	minimum 32 bit	alaptípustól függ
double_t(C99)	minimum 64 bit	alaptípustól függ

További típusok megfelelése az alaptípusoknak [47]

FLT_EVAL_METHOD	float_t	double_t
egy	float	double
2	double	double
3	long double	long double

Strings

Null végű karakterláncok

Noha a C-ben nincs speciális típusa a karakterláncoknak, a null-végződésű karakterláncok erősen használatosak a nyelvben. Az ASCII karakterláncok egy típusú tömbként vannak deklarálva, charamelynek utolsó eleme a karakterkód 0( '\0'). Az UTF-8 karakterláncokat ugyanabban a formátumban szokás tárolni . Az ASCII karakterláncokkal működő összes függvény azonban minden karaktert bájtnak tekint, ami korlátozza a szabványos függvények használatát ennek a kódolásnak a használatakor.

Annak ellenére, hogy széles körben elterjedt a null-végű karakterláncok gondolata, és néhány algoritmusban kényelmesen használhatók, számos komoly hátrányuk van.

Az, hogy a karakterlánc végére terminálkaraktert kell hozzáadni, nem teszi lehetővé, hogy egy részstringet másolás nélkül kapjunk, és a nyelv nem biztosít funkciókat a részkarakterláncra és annak hosszára mutató mutatóval való munkavégzéshez.
Ha a bemeneti adatokon alapuló algoritmus eredményéhez előzetesen memóriát kell lefoglalni, akkor minden alkalommal be kell járni a teljes karakterláncot a hosszának kiszámításához.
Ha nagy mennyiségű szöveggel dolgozik, a hosszszámítás szűk keresztmetszetet jelenthet .
Ha olyan karakterlánccal dolgozik, amely tévedésből nem nulla véget ért, meghatározatlan programviselkedéshez vezethet, beleértve a szegmentálási hibákat, a puffertúlcsordulási hibákat és a biztonsági réseket .

Modern körülmények között, amikor a kódteljesítmény prioritást élvez a memóriafelhasználással szemben, hatékonyabb és egyszerűbb lehet olyan struktúrákat használni, amelyek magát a karakterláncot és annak méretét is tartalmazzák [48] , például:

struct string_t { char * str ; // mutató a karakterláncra size_t str_size ; // karakterlánc mérete }; typedef struct string_t string_t ; // alternatív név a kód egyszerűsítésére

Egy alternatív, alacsony memóriaigényű karakterláncméret-tárolási megközelítés az lenne, ha a karakterláncot változó hosszúságú formátumban a méretével előtagozná.. Hasonló megközelítést alkalmaznak a protokollpufferekben is , azonban csak az adatátvitel szakaszában, de nem a tárolásukban.

String literálok

A C-beli karakterlánc-literálok eredendően állandók [10] . Deklarációkor dupla idézőjelek közé kerülnek, a terminátort 0a fordító automatikusan hozzáadja. A karakterlánc-literál hozzárendelésének két módja van: mutató és érték alapján. Mutatós hozzárendelés char *esetén a típusváltozóba beírunk egy változtathatatlan karakterláncra mutató mutatót, azaz konstans karakterláncot képezünk. Ha egy string literált ad meg egy tömbben, akkor a karakterlánc a verem területére kerül átmásolásra.

#include <stdio.h> #include <karakterlánc.h> int main ( érvénytelen ) { const char * s1 = "Const string" ; char s2 [] = "Módosítható karakterlánc" ; memcpy ( s2 , " c " , strlen ( " c " )); // módosítsa az első betűt kicsire tesz ( s2 ); // megjelenik a sor szövege memcpy (( char * ) s1 , "to" , strlen ( "to" )); // szegmentálási hiba tesz ( s1 ); // sor nem kerül végrehajtásra }

Mivel a karakterláncok szabályos karaktertömbök, literálok helyett inicializálók is használhatók, mindaddig, amíg minden karakter 1 bájtban elfér:

char s [] = { 'I' , 'n' , 'i' , 't' , 'i' , 'a' , 'l' , 'i' , 'z' , 'e' , 'r' , '\0' };

A gyakorlatban azonban ennek a megközelítésnek csak rendkívül ritka esetekben van értelme, amikor nem szükséges lezáró nullát hozzáadni egy ASCII karakterlánchoz.

Széles vonalak Típuskódolás wchar_ta platformtól függően

Felület	Kódolás
GNU/Linux	USC-4 [49]
Mac operációs rendszer	USC-4 [49]
ablakok	USC-2 [50]
AIX	USC-2 [50]
FreeBSD	A területtől függ nincs dokumentálva [50]
Solaris	A területtől függ nincs dokumentálva [50]

A szokásos karakterláncok alternatívája a széles karakterlánc, amelyben minden karakter egy speciális típusban van tárolva wchar_t. A szabvány által megadott típusnak képesnek kell lennie arra, hogy magában foglalja a létező legnagyobb területi beállítások összes karakterét . A széles karakterláncokkal való munkavégzés funkciói a fejlécfájlban wchar.h, a széles karakterekkel való munkavégzés funkciói pedig a fejlécfájlban találhatók wctype.h.

A széles karakterláncok karakterlánc-literáljának deklarálásakor a módosítót használjuk L:

const wchar_t * wide_str = L "Széles karakterlánc" ;

A formázott kimenet a specifikátort használja %ls, de a méretmeghatározó, ha adott, bájtokban van megadva, nem karakterekben [51] .

A típust wchar_túgy találták ki, hogy bármilyen karakter elférjen benne, széles karakterláncok pedig - bármilyen területi karakterláncok tárolására, de ennek eredményeként az API kényelmetlennek bizonyult, a megvalósítások pedig platformfüggőek voltak. Így a Windows platformon 16 bitet választottak a típus méretének wchar_t, majd később megjelent az UTF-32 szabvány, így wchar_ta Windows platformon a típus már nem fér bele az UTF-32 kódolásból származó összes karakterbe, aminek következtében ennek a típusnak a jelentése elvész [50] . Ugyanakkor Linux [49] és macOS platformokon ez a típus 32 bitet vesz igénybe, így a típus nem alkalmas többplatformos feladatok megvalósítására.wchar_t

Többbájtos karakterláncok

Számos különböző kódolás létezik, amelyekben egyetlen karakter különböző számú bájttal programozható. Az ilyen kódolásokat multibyte-nak nevezik. Az UTF-8 rájuk is vonatkozik . A C egy sor funkcióval rendelkezik a karakterláncok konvertálásához az aktuális nyelvterületen belüli többbájtosról szélesre és fordítva. A többbájtos karakterekkel való munkavégzés funkcióinak előtagja vagy utótagja mbvan, és leírásuk a fejlécfájlban található stdlib.h. A többbyte-os karakterláncok támogatásához a C programokban az ilyen karakterláncokat támogatni kell az aktuális területi szinten . A kódolás kifejezett beállításához módosíthatja az aktuális területi beállítást setlocale()a locale.h. A nyelvi beállítások kódolásának meghatározását azonban támogatnia kell a használt szabványos könyvtárnak. Például a Glibc szabványkönyvtár teljes mértékben támogatja az UTF-8 kódolást, és képes a szöveget sok más kódolásra konvertálni [52] .

A C11 szabványtól kezdve a nyelv támogatja a 16 bites és 32 bites szélességű többbyte-os karakterláncokat is megfelelő karaktertípusokkal char16_tés char32_tfejlécfájlból uchar.h, valamint az UTF-8 karakterlánc-literálok deklarálását a u8. 16 bites és 32 bites karakterláncok használhatók UTF-16 és UTF-32 kódolások tárolására, ha a uchar.hmakródefiníciók __STDC_UTF_16__és a fejlécfájlban vannak megadva __STDC_UTF_32__. A karakterlánc-literálok megadásához ezekben a formátumokban módosítókat használnak: u16 bites karakterláncokhoz és U32 bites karakterláncokhoz. Példák karakterlánc-literálok deklarálására többbájtos karakterláncokhoz:

const char * s8 = u8 "UTF-8 többbájtos karakterlánc" ; const char16_t * s16 = u "16 bites többbájtos karakterlánc" ; const char32_t * s32 = U "32 bites többbájtos karakterlánc" ;

Ne feledje, hogy a c16rtomb()16 bites karakterláncból többbájtos karakterláncokká konvertáló funkció nem működik a tervezett módon, és a C11 szabványban azt találták, hogy nem tud lefordítani UTF-16-ról UTF-8-ra [53] . Ennek a függvénynek a javítása a fordító konkrét megvalósításától függhet.

Egyéni típusok

Felsorolások

Az enumok elnevezett egész számok konstansok halmaza, amelyeket a kulcsszó jelöl enum. Ha egy konstans nincs számhoz társítva, akkor automatikusan vagy 0a lista első konstansához, vagy az előző konstansban megadottnál eggyel nagyobb számhoz kerül. Ebben az esetben maga a felsorolási adattípus valójában bármilyen előjeles vagy előjel nélküli primitív típusnak felelhet meg, amelynek tartományába az összes felsorolási érték belefér; A fordító dönti el, hogy melyik típust használja. Az állandók explicit értékeinek azonban olyan kifejezéseknek kell lenniük, mint a int[18] .

A felsorolás típusa névtelen is lehet, ha a felsorolásnév nincs megadva. A két különböző enumban megadott állandók két különböző adattípusúak, függetlenül attól, hogy az enumok nevesek vagy névtelenek.

A gyakorlatban a felsorolásokat gyakran használják véges automaták állapotainak jelzésére , működési módok vagy paraméterértékek beállítására [54] , egész szám konstansok létrehozására, valamint bármilyen egyedi objektum vagy tulajdonság felsorolására [55] .

Struktúrák

A struktúrák különböző adattípusok változóinak kombinációi ugyanazon a memóriaterületen belül; kulcsszóval jelöljük struct. A struktúrán belüli változókat a struktúra mezőinek nevezzük. A címtér szempontjából a mezők mindig ugyanabban a sorrendben követik egymást, ahogyan meg vannak adva, de a fordítók egymáshoz igazíthatják a mezőcímeket, hogy egy adott architektúrára optimalizálhassák. Így valójában a mező nagyobb méretű lehet, mint a programban megadott.

Minden mezőnek van egy bizonyos eltolása a struktúra címéhez és egy méretéhez képest. offsetof()Az eltolás a fejlécfájl makrójával érhető el stddef.h. Ebben az esetben az eltolás az előző mezők igazításától és méretétől függ. A mező méretét általában a szerkezet igazítása határozza meg: ha a mező adattípus igazítási mérete kisebb, mint a struktúra igazítás értéke, akkor a mező méretét a szerkezet igazítása határozza meg. Az adattípus-igazítás a fejlécfájl alignof()[f] makrójával érhető el stdalign.h. Maga a szerkezet mérete az összes mezőjének teljes mérete, beleértve az igazítást is. Ugyanakkor egyes fordítók speciális attribútumokat biztosítanak, amelyek lehetővé teszik a struktúrák becsomagolását, eltávolítva belőlük az igazításokat [56] .

A struktúramezőket a mező definíciója és a bitek száma után kettősponttal elválasztott bitekben lehet kifejezetten méretre állítani, ami a mező típusától függetlenül korlátozza a lehetséges értékük tartományát. Ez a megközelítés a jelzők és bitmaszkok alternatívájaként használható a hozzáférésükhöz. A bitek számának megadása azonban nem szünteti meg a struktúrák mezőinek lehetséges igazítását a memóriában. A bitmezőkkel való munkavégzésnek számos korlátja van: nem lehet hozzájuk operátort sizeofvagy makrót alkalmazni alignof(), nem lehet rájuk mutatni.

Egyesületek

Az uniókra akkor van szükség, ha ugyanarra a változóra szeretne hivatkozni különböző adattípusokként; kulcsszóval jelöljük union. Az unión belül tetszőleges számú metsző mező deklarálható, amelyek valójában ugyanahhoz a memóriaterülethez biztosítanak hozzáférést, mint különböző adattípusok. Az unió méretét a fordító választja ki az unió legnagyobb mezőjének mérete alapján. Figyelembe kell venni, hogy az unió egy mezőjének megváltoztatása az összes többi mező változásához vezet, de garantáltan csak a megváltozott mező értéke lesz helyes.

A szakszervezetek kényelmesebb alternatívaként szolgálhatnak a mutató tetszőleges típusra való öntésére. Például egy struktúrában elhelyezett unióval dinamikusan változó adattípusú objektumokat hozhat létre:

Struktúrakód az adattípus menet közbeni megváltoztatásához #include <stddef.h> enum value_type_t { VALUE_TYPE_LONG , // egész szám VALUE_TYPE_DOUBLE , // valós szám VALUE_TYPE_STRING , // karakterlánc VALUE_TYPE_BINARY , // tetszőleges adat }; struct binary_t { érvénytelen * adat ; // mutat az adatokra size_t data_size ; // adatméret }; struct string_t { char * str ; // mutató a karakterláncra size_t str_size ; // karakterlánc mérete }; union value_contents_t { long as_long ; // értéket egész számként double as_double ; // valós számként struct string_t as_string ; // érték karakterláncként struct binary_t as_binary ; // érték tetszőleges adatként }; struktúra érték_t { enum érték_típus_t típusa ; // érték tipusa union value_contents_t contents ; // értéktartalom }; Tömbök

A C tömbök primitívek, és csak szintaktikai absztrakciót jelentenek a mutató aritmetikája felett . A tömb maga egy memóriaterületre mutató mutató, így a tömbdimenzióról és annak határairól minden információ csak fordítási időben érhető el a típusdeklaráció szerint. A tömbök lehetnek egydimenziósak vagy többdimenziósak, de egy tömbelem eléréséhez egyszerűen ki kell számítani az eltolást a tömb kezdetének címéhez képest. Mivel a tömbök címaritmetikán alapulnak, lehetséges indexek használata nélkül is dolgozni velük [57] . Így például a következő két példa 10 szám kiolvasására a bemeneti adatfolyamból megegyezik egymással:

Az indexeken keresztül végzett munka összehasonlítása a címaritmetikával végzett munkával

Példakód az indexek feldolgozásához	Példakód a címaritmetika kezeléséhez
#include <stdio.h> int a [ 10 ] = { 0 }; // Nulla inicializálás unsigned int count = sizeof ( a ) / sizeof ( a [ 0 ]); for ( int i = 0 ; i < count ; ++ i ) { int * ptr = &a [ i ]; // Mutató az aktuális tömbelemre int n = scanf ( "%8d" , ptr ); if ( n != 1 ) { perror ( "Nem sikerült beolvasni az értéket" ); // A hibatörés kezelése ; } }	#include <stdio.h> int a [ 10 ] = { 0 }; // Nulla inicializálás unsigned int count = sizeof ( a ) / sizeof ( a [ 0 ]); int * a_end = a + count ; // Mutató az utolsó után következő elemre for ( int * ptr = a ; ptr != a_end ; ++ ptr ) { int n = scanf ( "%8d" , ptr ); if ( n != 1 ) { perror ( "Nem sikerült beolvasni az értéket" ); // A hibatörés kezelése ; } }

Az ismert méretű tömbök hosszát a fordításkor számítjuk ki. A C99 szabvány bevezette a változó hosszúságú tömbök deklarálásának lehetőségét, amelyek hossza futás közben beállítható. Az ilyen tömbök a veremterületről kapnak memóriát, ezért óvatosan kell használni őket, ha a méretük a programon kívülről is beállítható. A dinamikus memóriafoglalástól eltérően a veremterület megengedett méretének túllépése előre nem látható következményekhez vezethet, és a negatív tömbhossz meghatározatlan viselkedés . A C11 -től kezdve a változó hosszúságú tömbök nem kötelezőek a fordítók számára, a támogatás hiányát pedig egy makró jelenléte határozza meg __STDC_NO_VLA__[58] .

A lokális vagy globális változóként deklarált rögzített méretű tömbök inicializálhatók úgy, hogy kapcsos kapcsos zárójelekkel és vesszővel elválasztva listázzák a tömbelemeket. A globális tömb inicializálói csak olyan kifejezéseket használhatnak, amelyeket a fordításkor kiértékelnek [59] . Az ilyen kifejezésekben használt változókat konstansként kell deklarálni, a módosítóval const. A helyi tömbök esetében az inicializálók tartalmazhatnak kifejezéseket függvényhívásokkal és más változók használatával, beleértve a deklarált tömbre mutató mutatót is.

A C99 szabvány óta megengedett egy tetszőleges hosszúságú tömb deklarálása a struktúrák utolsó elemeként, amelyet a gyakorlatban széles körben használnak, és különböző fordítók támogatnak. Egy ilyen tömb mérete a struktúrához lefoglalt memória mennyiségétől függ. Ebben az esetben nem deklarálhat ilyen struktúrák tömbjét, és nem helyezheti el őket más struktúrákba. Az ilyen struktúrákon végzett műveleteknél általában figyelmen kívül hagynak egy tetszőleges hosszúságú tömböt, beleértve a struktúra méretének kiszámítását is, és a tömbön túllépés definiálatlan viselkedést von maga után [60] .

A C nyelv nem vezérli a tömb határokon kívüli határait, ezért magának a programozónak kell figyelnie a tömbökkel végzett munkát. A tömbfeldolgozás során fellépő hibák nem mindig befolyásolják közvetlenül a program végrehajtását, de szegmentációs hibákhoz és sebezhetőségekhez vezethetnek .

Szinonimák beírása

A C nyelv lehetővé teszi saját típusnevek létrehozását a typedef. Alternatív nevek adhatók mind a rendszertípusoknak, mind a felhasználó által meghatározottaknak. Az ilyen nevek a globális névtérben vannak deklarálva, és nem ütköznek a szerkezet, a felsorolás és az uniótípusok neveivel.

Alternatív nevek egyaránt használhatók a kód egyszerűsítésére és az absztrakciós szintek létrehozására. Például egyes rendszertípusok lerövidíthetők, hogy a kód olvashatóbb legyen, vagy egységesebb legyen a felhasználói kódban:

#include <stdint.h> typedef int32_t i32_t ; typedef int_fast32_t i32fast_t ; typedef int_least32_t i32least_t ; typedef uint32_t u32_t ; typedef uint_fast32_t u32fast_t ; typedef uint_least32_t u32least_t ;

Az absztrakcióra példa az operációs rendszerek fejlécfájljaiban található típusnevek. Például a POSIX szabvány meghatároz egy típust pid_ta numerikus folyamatazonosító tárolására. Valójában ez a típus egy alternatív neve néhány primitív típushoz, például:

typedef int __kernel_pid_t ; typedef __kernel_pid_t __pid_t typedef __pid_t pid_t ;

Mivel az alternatív nevű típusok csak szinonimái az eredeti típusoknak, a teljes kompatibilitás és felcserélhetőség megmarad közöttük.

Előfeldolgozó

Az előfeldolgozó a fordítás előtt működik, és átalakítja a programfájl szövegét a benne talált vagy az előfeldolgozónak átadott direktívák szerint . Technikailag az előfeldolgozó többféleképpen is megvalósítható, de logikailag kényelmes egy külön modulnak tekinteni, amely minden fordításra szánt fájlt feldolgoz, és kialakítja a szöveget, amely azután a fordító bemenetére kerül. Az előfeldolgozó olyan sorokat keres a szövegben, amelyek karakterrel kezdődnek #, majd az előfeldolgozó direktíváit követik. Minden, ami nem tartozik az előfeldolgozó direktívákhoz, és az irányelvek szerint nincs kizárva a fordításból, változatlanul átkerül a fordító bemenetére.

Az előfeldolgozó jellemzői a következők:

adott lexéma helyettesítése szöveggel a direktíva segítségével #define, beleértve a paraméterezett szövegsablonok létrehozásának lehetőségét (a függvényekhez hasonlóan), valamint az ilyen helyettesítések törlését, ami lehetővé teszi a programszöveg korlátozott területein a helyettesítést;
feltételes beágyazás és töredékek eltávolítása a szövegből, beleértve magukat az irányelveket is, a #ifdef, #ifndef, #if, #elseés feltételes parancsok használatával #endif;
beágyazhat szöveget egy másik fájlból az aktuális fájlba a #include.

Fontos megérteni, hogy az előfeldolgozó csak szöveghelyettesítést biztosít, nem veszi figyelembe a nyelv szintaxisát és szemantikáját. Így például a makródefiníciók #defineelőfordulhatnak függvényekben vagy típusdefiníciókban, a feltételes fordítási direktívák pedig a kód bármely részének kizárásához vezethetnek a program lefordított szövegéből, függetlenül a nyelv nyelvtanától. A paraméteres makró hívása azért is különbözik a függvény meghívásától, mert a vesszővel elválasztott argumentumok szemantikája nincs elemezni. Így például lehetetlen egy tömb inicializálását átadni egy parametrikus makró argumentumainak, mivel az elemei is vesszővel vannak elválasztva:

#define array_of(type, array) (((típus) []) (tömb)) int * a ; a = tömb_of ( int , { 1 , 2 , 3 }); // fordítási hiba: // Az "array_of" makró 4 argumentumot adott át, de csak 2

A makródefiníciókat gyakran használják a könyvtárak különböző verzióival való kompatibilitás biztosítására, amelyek megváltoztatták az API -kat , beleértve a programkönyvtár verziójától függően bizonyos kódszakaszokat. Ebből a célból a könyvtárak gyakran adnak hozzá makródefiníciókat, amelyek leírják a verziójukat [61] , és néha olyan paraméterekkel ellátott makrókat, amelyek az aktuális verziót összehasonlítják az előfeldolgozóban [62] megadottal . A makródefiníciókat a program egyes részeinek feltételes fordítására is használják , például bizonyos további funkciók támogatására.

A paraméterekkel rendelkező makródefiníciókat széles körben használják a C programokban általános függvények analógjainak létrehozására . Korábban inline függvények megvalósítására is szolgáltak, de a C99 szabvány óta ez az igény a inline-függvények kiegészítése miatt megszűnt. Tekintettel azonban arra, hogy a paraméterekkel rendelkező makródefiníciók nem függvények, hanem hasonló módon hívják őket, váratlan problémák léphetnek fel programozói hiba miatt, beleértve a makródefinícióból származó kód egy részének feldolgozását [63] és a hibás prioritásokat. műveletek végrehajtása [64] . Példa a hibás kódra a négyzetesítési makró:

#include <stdio.h> int main ( érvénytelen ) { #define SQR(x) x * x printf ( "%d" , SQR ( 5 )); // minden helyes, 5*5=25 printf ( "%d" , SQR ( 5 + 0 )); // állítólag 25, de 5-öt ad ki (5+0*5+0) printf ( "%d" , SQR ( 4/3 ) ) ; // minden helyes, 1 (mert 4/3=1, 1*4=4, 4/3=1) printf ( "%d" , SQR ( 5/2 ) ) ; // 4-nek (2*2) kellene lennie, de 5-öt ad ki (5/2*5/2) return 0 ; }

A fenti példában az a hiba, hogy a makró argumentum tartalma a szövegbe úgy van behelyettesítve, ahogy van, anélkül, hogy figyelembe vennénk a műveletek elsőbbségét. Ilyen esetekben a inline-függvényeket kell használnia, vagy kifejezetten prioritást kell adnia az operátoroknak olyan kifejezésekben, amelyek makróparamétereket használnak zárójelben:

#include <stdio.h> int main ( érvénytelen ) { #define SQR(x) ((x) * (x)) printf ( "%d" , SQR ( 4 + 1 )); // igaz, 25 return 0 ; }

C programozás

Programstruktúra

Modulok

A program olyan C fájlok halmaza, amelyek objektumfájlokká fordíthatók . Az objektumfájlok ezután egy összekapcsolási lépésen mennek keresztül egymással, valamint a külső könyvtárakkal, ami a végső végrehajtható fájlt vagy könyvtárat eredményezi . A fájlok egymással, valamint könyvtárakkal való összekapcsolásához szükség van az egyes fájlokban a használt funkciók prototípusainak, a külső változóknak és a szükséges adattípusoknak a leírására. Szokásos az ilyen adatokat külön fejlécfájlokba helyezni , amelyek direktívával #include kapcsolódnak azokban a fájlokban, ahol ez vagy az a funkció szükséges, és lehetővé teszik egy modulrendszerhez hasonló rendszer megszervezését. Ebben az esetben a modul lehet:

egyedi fájlok forráskóddal ellátott halmaza, amelyekhez a felület fejlécfájlok formájában jelenik meg;
objektumkönyvtár vagy annak egy része, a megfelelő fejlécfájlokkal;
egy vagy több fejlécfájl önálló halmaza (interfészkönyvtár);
statikus könyvtár vagy annak egy része megfelelő fejlécfájlokkal;
dinamikus könyvtár vagy annak egy része megfelelő fejlécfájlokkal.

Mivel az irányelv #includecsak egy másik fájl szövegét helyettesíti az előfeldolgozó szakaszban , ugyanazon fájl többszöri beépítése fordítási hibákhoz vezethet. Ezért az ilyen fájlok makrók és [65] használatával védelmet használnak az újraengedélyezés ellen . #define#ifndef

Forráskód fájlok

A C forráskód fájl törzse globális adatdefiníciók, típusok és függvények halmazából áll. A és a specifikációkkal deklarált globális változók és függvények csak abban a fájlban staticérhetők inlineel, amelyben deklarálva vannak, vagy ha az egyik fájl egy másikba a #include. Ebben az esetben a fejlécfájlban a szóval deklarált függvények és változók staticminden alkalommal újra létrejönnek, amikor a fejlécfájl a következő forráskóddal rendelkező fájlhoz kapcsolódik. A külső specifikációval deklarált globális változókat és függvényprototípusokat a rendszer más fájlokból származónak tekinti. Vagyis a leírásnak megfelelően használhatók; feltételezzük, hogy a program felépítése után a linker összekapcsolja őket a fájljaikban leírt eredeti objektumokkal és függvényekkel.

staticA globális változók és függvények – a és kivételével – inlinemás fájlokból is elérhetők, feltéve, hogy ott megfelelően deklarálva vannak a specifikátorral extern. A módosítóval deklarált változók és függvények staticmás fájlokban is elérhetők, de csak akkor, ha a címüket mutató adja át. Írja be a deklarációkat typedef, structés unionnem importálható más fájlba. Ha más fájlokban kell használni őket, akkor ott kell megkettőzni, vagy külön fejlécfájlba helyezni. Ugyanez vonatkozik a inline-függvényekre is.

Program belépési pont

Egy végrehajtható program esetében a szabványos belépési pont egy függvény main, amely nem lehet statikus, és csak a programban kell lennie. A program végrehajtása a függvény első utasításától kezdődik és a main()kilépésig folytatódik, ezután a program leáll, és visszaküldi az operációs rendszernek a munkája eredményének absztrakt egész kódját.

Érvényes függvényprototípusok main()[66]

nincsenek érvek	Parancssori argumentumokkal
int main ( void );	int main ( int argc , char ** argv );

Meghíváskor a változót argca programnak átadott argumentumok száma adja át, beleértve magának a programnak az elérési útját is, így az argc változó általában 1-nél nem kisebb értéket tartalmaz. argvMaga a programindító sor tömbként kerül átadásra a változónak szöveges karakterláncokból, amelyek utolsó eleme a NULL. A fordító garantálja, hogy main()a programban lévő összes globális változó inicializálva lesz a függvény futtatásakor [67] .

Ennek eredményeként a függvény main()bármilyen egész számot visszaadhat a típusú értéktartományban , amelyet a program visszatérési kódjaként inttovábbít az operációs rendszernek vagy más környezetnek [66] . A nyelvi szabvány nem határozza meg a visszatérési kódok jelentését [68] . Általában az operációs rendszer, ahol a programok futnak, rendelkezik valamilyen eszközzel a visszatérési kód értékének lekérésére és elemzésére. Néha vannak bizonyos konvenciók ezeknek a kódoknak a jelentésével kapcsolatban. Az általános konvenció az, hogy a nulla visszatérési kód a program sikeres befejezését jelzi, míg a nullától eltérő érték hibakódot jelent. A fejlécfájl két általános makródefiníciót határoz meg és , amelyek megfelelnek a program sikeres és sikertelen befejezésének [68] . A visszatérési kódok olyan alkalmazásokon belül is használhatók, amelyek több folyamatot tartalmaznak a folyamatok közötti kommunikáció biztosítására, ebben az esetben az alkalmazás maga határozza meg az egyes visszatérési kódok szemantikai jelentését. stdlib.hEXIT_SUCCESSEXIT_FAILURE

Munka a memóriával

Memóriamodell

A C 4 módot biztosít a memória lefoglalására, amelyek meghatározzák a változó élettartamát és inicializálásának pillanatát [67] .

Memóriakiosztási módszerek [67]

Kiválasztási módszer	Célok	Kiválasztás ideje	kiadás ideje	Általános költségek
Statikus memóriafoglalás	Globális változók és kulcsszóval jelölt változók static(de nélkül _Thread_local)	A program indításakor	A program végén	Hiányzó
Memóriakiosztás szál szinten	Kulcsszóval jelölt változók_Thread_local	Amikor elindul a cérna	A patak végén	A szál létrehozásakor
Automatikus memóriafoglalás	Függvényargumentumok és visszatérési értékek, függvények lokális változói, beleértve a változó hosszúságú regisztereket és tömböket	Funkciók veremszintű hívásakor .	Automatikusan a funkciók befejezésekor	Lényegtelen, mivel csak a verem tetejére mutató mutató változik
Dinamikus memóriafoglalás	A függvényeken keresztül lefoglalt memória malloc(), calloc()ésrealloc()	Manuálisan a kupacból a használt függvény meghívásának pillanatában.	A funkció manuális használatávalfree()	Kiosztáshoz és kiadáshoz egyaránt nagy

Mindezek az adattárolási módszerek különböző helyzetekben alkalmasak, és megvannak a maga előnyei és hátrányai. A globális változók nem teszik lehetővé újra belépő algoritmusok írását , és az automatikus memóriafoglalás nem teszi lehetővé tetszőleges memóriaterület visszaadását függvényhívásból. Az automatikus lefoglalás szintén nem alkalmas nagy mennyiségű memória lefoglalására, mivel verem- vagy kupacsérüléshez vezethet [69] . A dinamikus memória nem rendelkezik ezekkel a hiányosságokkal, de használatakor nagy a többletköltsége, és nehezebben használható.

Ahol lehetséges, az automatikus vagy statikus memóriafoglalást részesítjük előnyben: az objektumok tárolásának ezt a módját a fordító vezérli , ami megszabadítja a programozót a kézi memóriafoglalás és -felszabadítás fáradságától, ami általában a nehezen fellelhető memóriaszivárgások forrása . szegmentálási hibák és a program hibáinak újrafelszabadítása . Sajnos sok adatstruktúra futási időben változó méretű, így mivel az automatikusan és statikusan lefoglalt területeknek a fordítási időben ismert fix mérettel kell rendelkezniük, nagyon gyakori a dinamikus kiosztás használata.

Az automatikusan allokált változók esetén egy módosító registersegítségével utalhat a fordítóprogramra, hogy gyorsan hozzáférjen hozzájuk. Az ilyen változókat a processzor regisztereibe lehet helyezni. A korlátozott számú regiszter és a fordítóoptimalizálás miatt előfordulhat, hogy a változók a közönséges memóriába kerülnek, ennek ellenére a programból nem lehet majd mutatót kapni rájuk [70] . A módosító registeraz egyetlen, amely a függvény argumentumaiban adható meg [71] .

Memóriacímzés

A C nyelv lineáris memóriacímzést örökölt, amikor struktúrákkal, tömbökkel és lefoglalt memóriaterületekkel dolgozott. A nyelvi szabvány azt is lehetővé teszi, hogy összehasonlítási műveleteket hajtsanak végre nullmutatókon és tömbökön, struktúrákon és lefoglalt memóriaterületeken belüli címeken. Az utolsó utáni tömbelem címével is dolgozhatunk, ami az írási algoritmusok megkönnyítése érdekében történik. A különböző változókhoz (vagy memóriaterületekhez) kapott címmutatók összehasonlítását azonban nem szabad elvégezni, mivel az eredmény egy adott fordító megvalósításától függ [72] .

Memóriaábrázolás

A program memóriaábrázolása a hardver architektúrától, az operációs rendszertől és a fordítótól függ. Így például a legtöbb architektúrán a verem csökken, de vannak olyan architektúrák, ahol a verem nő [73] . A verem és a kupac közötti határ részben védhető a verem túlcsordulásától egy speciális memóriaterülettel [74] . A könyvtárak adatainak és kódjának helye pedig a fordítási lehetőségektől függhet [75] . A C szabvány elvonatkoztatja a megvalósítást, és lehetővé teszi hordozható kód írását, de a folyamat memóriaszerkezetének megértése segít a hibakeresésben és a biztonságos és hibatűrő alkalmazások írásában.

A folyamatmemória tipikus ábrázolása Unix-szerű operációs rendszerekben

Amikor egy programot elindítanak egy végrehajtható fájlból, a processzor utasításai (gépi kód) és az inicializált adatok importálódnak a RAM-ba. main()Ugyanakkor a parancssori argumentumok ( amelyek a második argumentumban a következő aláírással rendelkező függvényekben érhetők el int argc, char ** argv) és a környezeti változók importálódnak magasabb címekre .

Az inicializálatlan adatterület olyan globális változókat tartalmaz (beleértve a ként deklaráltakat is static), amelyek nincsenek inicializálva a programkódban. Az ilyen változók alapértelmezés szerint nullára vannak inicializálva a program indítása után. Az inicializált adatok területe - az adatszegmens - globális változókat is tartalmaz, de ez a terület azokat a változókat tartalmazza, amelyek kezdeti értéket kaptak. A megváltoztathatatlan adatok, beleértve a módosítóval deklarált változókat const, karakterlánc-literálokat és egyéb összetett literálokat, a programszöveg szegmensbe kerülnek. A programszöveg szegmens végrehajtható kódot is tartalmaz, és csak olvasható, így az ebből a szegmensből származó adatok módosításának kísérlete meghatározatlan viselkedést eredményez szegmentációs hiba formájában .

A veremterület funkcióhívásokhoz és helyi változókhoz kapcsolódó adatokat tartalmaz . Minden egyes függvényvégrehajtás előtt a verem kibővül, hogy illeszkedjen a függvénynek átadott argumentumokhoz. Munkája során a függvény a veremben lokális változókat tud lefoglalni, és memóriát lefoglalni rajta a változó hosszúságú tömbökhöz, illetve egyes fordítók lehetőséget is biztosítanak a veremen belüli memória lefoglalására olyan híváson keresztül alloca(), amely nem szerepel a nyelvi szabványban. . A függvény lejárta után a verem a hívás előtti értékre csökken, de ez nem biztos, hogy megtörténik, ha a veret rosszul kezeli. A dinamikusan lefoglalt memória a halomból származik .

Fontos részlet a véletlenszerű kitöltés jelenléte a verem és a felső terület között [77] , valamint az inicializált adatterület és a kupac között . Ez biztonsági okokból történik, például más funkciók egymásra halmozásának megakadályozása érdekében.

A dinamikus hivatkozási könyvtárak és a fájlrendszer fájlleképezései a verem és a kupac között helyezkednek el [78] .

Hibakezelés

A C nem rendelkezik beépített hibaellenőrző mechanizmusokkal, de számos általánosan elfogadott módszer létezik a hibák kezelésére a nyelv használatával. Általánosságban elmondható, hogy a hibatűrő kódokban a C hibák kezelésének gyakorlata nehézkes, gyakran ismétlődő konstrukciók írására kényszeríti az embert, amelyben az algoritmust hibakezeléssel kombinálják .

Hibajelzők és errno

A C nyelv aktívan használ egy speciális változót errnoa fejlécfájlból errno.h, amelyben a függvények beírják a hibakódot, miközben a hibajelző értéket adják vissza. Az eredmény hibaellenőrzéséhez az eredményt összehasonlítja a hibajelzővel, és ha egyezik, akkor elemezheti a tárolt hibakódot errnoa program javításához vagy hibakeresési üzenet megjelenítéséhez. A szabványos könyvtárban a szabvány gyakran csak a visszaadott hibajelzőket határozza meg, és a beállítás errnoimplementációfüggő [79] .

A következő értékek általában hibajelzőként működnek:

-1a típusra intolyan esetekben, amikor nem használunk negatív eredménytartományt [80] ;
-1típushoz ssize_t(POSIX) [81] ;
(size_t) -1típushoz size_t[80] ;
(time_t) -1amikor egyes funkciókat használ az idővel való munkavégzésre [80] ;
NULLmutatókhoz [80] ;
EOFfájlok streamelésekor [80] ;
nem nulla hibakód [80] .

Az a gyakorlat, hogy hibakód helyett hibajelzőt adunk vissza, bár megspórolja a függvénynek átadott argumentumok számát, bizonyos esetekben emberi tényező hatására hibákhoz vezet. Például gyakori, hogy a programozók figyelmen kívül hagyják a típusú eredmény ellenőrzését ssize_t, és magát az eredményt használják tovább a számításokban, ami finom hibákhoz vezet, ha a -1[82] -t adjuk vissza .

A helyes érték visszaadása hibajelzőként [82] tovább járul hozzá a hibák megjelenéséhez , ami egyben több ellenőrzésre, és ennek megfelelően több azonos típusú ismétlődő kód írására kényszeríti a programozót. Ezt a megközelítést olyan adatfolyamfüggvényeknél alkalmazzák, amelyek típusú objektumokkal dolgoznak FILE *: a hibajelző az érték EOF, amely egyben a fájlvégi jelző is. Ezért EOFnéha ellenőriznie kell a karakterfolyamot mind a fájl végének szempontjából a függvény használatával feof(), mind a hiba jelenlétét a ferror()[83] használatával . Ugyanakkor néhány EOF, a szabvány szerint visszatérő függvényt nem kell beállítani errno[79] .

Az egységes hibakezelési gyakorlat hiánya a szabványos könyvtárban az egyedi hibakezelési módszerek megjelenéséhez és az általánosan használt módszerek kombinációjához vezet a harmadik féltől származó projektekben. Például a systemd projektben egy hibakód és egy szám jelölőként való visszaadásának ötleteit -1kombinálták - negatív hibakódot ad vissza [84] . A GLib könyvtár pedig bevezette azt a gyakorlatot, hogy hibajelzőként logikai értéket adnak vissza, miközben a hiba részleteit egy speciális struktúrában helyezik el, amelyre a mutató a függvény utolsó argumentumán keresztül kerül vissza [85] . Hasonló megoldást használ az Enlightenment projekt is, amely szintén logikai típust használ jelölőként, de a szabványos könyvtárhoz hasonló hibainformációkat ad vissza - egy külön függvényen [86] keresztül , amelyet ellenőrizni kell, ha jelölőt adott vissza.

Hibakód visszaküldése

A hibajelzők alternatívája a hibakód közvetlen visszaadása, és a függvény eredményének visszaadása mutató argumentumokon keresztül. A POSIX szabvány fejlesztői ezt az utat választották, melynek funkcióiban a hibakódot típusszámként szokás visszaadni int. A típusérték visszaadása intazonban nem teszi egyértelművé, hogy a hibakódot küldi vissza, és nem a tokent, ami hibákhoz vezethet, ha az ilyen függvények eredményét az értékhez hasonlítják -1. A C11 szabvány K kiterjesztése egy speciális típust vezet be a errno_thibakód tárolására. Javasoljuk, hogy ezt a típust használja a felhasználói kódban a hibák visszaadásához, és ha a szabványos könyvtár nem biztosítja, akkor deklarálja azt [87] :

#ifndef __STDC_LIB_EXT1__ typedef int errno_t ; #endif

Ez a megközelítés a kód minőségének javítása mellett kiküszöböli a használatának szükségességét errno, amely lehetővé teszi, hogy újra belépő függvényekkel rendelkező könyvtárakat készítsen anélkül, hogy további könyvtárakat, például POSIX szálakat kellene tartalmaznia a megfelelő meghatározásához errno.

Hibák a matematikai függvényekben

Bonyolultabb a fejlécfájlból származó matematikai függvények hibáinak kezelése, math.hamelyben 3 típusú hiba fordulhat elő [88] :

túllép a bemeneti értékek tartományán;
véges bemeneti adatokra végtelen eredményt kapni;
az eredmény kívül esik a használt adattípus tartományán.

A három hibatípus közül kettőnek a megelőzése a bemeneti adatok érvényes értéktartományának ellenőrzésén múlik. Az eredmény kimenetét azonban a típus határain túl rendkívül nehéz megjósolni. Ezért a nyelvi szabvány lehetőséget biztosít a matematikai függvények hibaelemzésére. A C99 szabványtól kezdve ez az elemzés kétféleképpen lehetséges, attól függően, hogy mekkora értéket tárol a math_errhandling.

Ha a bit be van állítva MATH_ERRNO, akkor a változót errnoelőször vissza kell állítani -ra 0, majd a matematikai függvény meghívása után ellenőrizze a hibákat EDOMés a ERANGE.
Ha a bit be van állítva MATH_ERREXCEPT, akkor az esetleges matematikai hibákat a függvény korábban visszaállítja feclearexcept()a fejlécfájlból fenv.h, majd a matematikai függvény meghívása után a függvény segítségével teszteli azokat fetestexcept().

Ebben az esetben a hibakezelés módját a szabványos könyvtár konkrét megvalósítása határozza meg, és előfordulhat, hogy teljesen hiányzik. math_errhandlingEzért a platformfüggetlen kódban a [88] értékétől függően szükség lehet az eredmény ellenőrzésére egyszerre kétféleképpen .

Erőforrások felszabadítása

Általában egy hiba előfordulásához a függvénynek ki kell lépnie, és vissza kell adnia egy hibajelzőt. Ha egy funkcióban hiba léphet fel annak különböző részein, akkor a működése során lefoglalt erőforrásokat fel kell szabadítani a szivárgások elkerülése érdekében. Jó gyakorlat az erőforrások felszabadítása a függvényből való visszatérés előtt fordított sorrendben, hiba esetén pedig a fő függvény után fordított sorrendben return. gotoAz ilyen kiadások külön részeiben a [89] operátor segítségével ugorhat . Ez a megközelítés lehetővé teszi, hogy a végrehajtandó algoritmushoz nem kapcsolódó kódrészleteket magán az algoritmuson kívül helyezze át, növelve a kód olvashatóságát, és hasonló defera Go programozási nyelv operátorának munkájához . Az erőforrások felszabadítására egy példa látható alább, a példák részben .

A programon belüli erőforrások felszabadításához egy programkilépés-kezelő mechanizmus biztosított. A kezelők egy függvény segítségével vannak hozzárendelve, atexit()és mind a függvény végén main()utasítással return, mind a függvény végrehajtásakor végrehajtódnak exit(). Ebben az esetben a kezelőket nem hajtják végre a abort()és a _Exit()[90] függvények .

Az erőforrások felszabadítására egy program végén példa a globális változók számára lefoglalt memória felszabadítása. Annak ellenére, hogy a memória így vagy úgy felszabadul a program leállása után az operációs rendszer által, és nem szabad felszabadítani a program működése során szükséges memóriát [91] , az explicit felosztás előnyösebb, mivel ez teszi könnyebben megtalálja a memóriaszivárgást harmadik féltől származó eszközökkel, és csökkenti a hiba következtében fellépő memóriaszivárgás lehetőségét:

Minta programkód erőforrás kiadással #include <stdio.h> #include <stdlib.h> int számok_száma ; int * számok ; void free_numbers ( érvénytelen ) { ingyenes ( számok ); } int main ( int argc , char ** argv ) { if ( arg < 2 ) { kilépés ( EXIT_FAILURE ); } számok_száma = atoi ( argv [ 1 ]); if ( számok_száma <= 0 ) { kilépés ( EXIT_FAILURE ); } számok = calloc ( számok_száma , mérete ( * számok )); if ( ! számok ) { perror ( "Hiba a tömb memóriafoglalása során" ); kilépés ( EXIT_FAILURE ); } atexit ( szabad_számok ); // ... munka számtömbbel // Itt automatikusan meghívódik a free_numbers() kezelő return EXIT_SUCCESS ; }

Ennek a megközelítésnek az a hátránya, hogy a hozzárendelhető kezelők formátuma nem teszi lehetővé tetszőleges adatok átadását a függvénynek, ami lehetővé teszi, hogy csak globális változókhoz hozzon létre kezelőket.

Példák C programokra

Minimális C program

Egy minimális C program, amely nem igényel argumentumfeldolgozást, a következő:

int main ( érvénytelen ){}

Nem szabad operátort írni returna függvényhez main(). Ebben az esetben a szabvány szerint a függvény main()0-t ad vissza, végrehajtva a függvényhez rendelt összes kezelőt exit(). Ez azt feltételezi, hogy a program sikeresen befejeződött [40] .

Helló Világ!

szia világ! Kernighan és Ritchie " The C Programming Language " című könyvének első kiadásában található :

#include <stdio.h> int main ( void ) // Nem vesz fel argumentumokat { printf ( "Hello, world! \n " ); // '\n' - új sor visszatérése 0 ; // Sikeres programlezárás }

Ez a program kinyomtatja a Hello, world! ' szabványos kimeneten .

Hibakezelés a fájlolvasás példakénti használatával

Sok C függvény hibát jelezhet anélkül, hogy megtenné azt, amit kellett volna. A hibákat ellenőrizni kell, és helyesen kell reagálni rájuk, ideértve gyakran azt is, hogy a hibát egy függvényből magasabb szintre kell dobni elemzés céljából. Ugyanakkor az a funkció, amelyben hiba történt, újra beléptetővé tehető , ebben az esetben tévedésből a funkciónak nem szabad megváltoztatnia a bemeneti vagy kimeneti adatokat, ami lehetővé teszi a hibahelyzet kijavítása után biztonságos újraindítását.

A példa megvalósítja a C nyelvű fájl beolvasásának függvényét, de megköveteli, hogy a függvények fopen()és a POSIXfread() szabvány megfeleljen , ellenkező esetben előfordulhat, hogy nem állítják be a változót , ami nagymértékben megnehezíti mind a hibakeresést, mind az univerzális és biztonságos kód írását. Nem POSIX platformokon ennek a programnak a viselkedése meghatározatlan lesz hiba esetén . Az olvashatóságot javító fő algoritmus mögött a hibákkal kapcsolatos erőforrások felosztása áll, és az átmenet a [89] segítségével történik . errnogoto

Fájlolvasó példakód hibakezeléssel #include <errno.h> #include <stdio.h> #include <stdlib.h> // Határozza meg a hibakód tárolásának típusát, ha nincs megadva #ifndef __STDC_LIB_EXT1__ typedef int errno_t ; #endif enum { EOK = 0 , // az errno_t értéke a sikerre }; // Funkció a fájl tartalmának beolvasására errno_t get_file_contents ( const char * fájlnév , void ** contents_ptr , size_t * contents_size_ptr ) { FÁJL * f ; f = fopen ( fájlnév , "rb" ); if ( ! f ) { // A POSIX-ben az fopen() tévedésből errno-t állít be return errno ; } // Fájlméret lekérése fseek ( f , 0 , SEEK_END ); long contents_size = ftell ( f ); if ( contents_size == 0 ) { * contents_ptr = NULL ; * contents_size_ptr = 0 ; goto cleaning_fopen ; } visszatekerés ( f ); // Változó a visszaadott hibakód tárolására errno_t saved_errno ; érvénytelen * tartalom ; tartalom = malloc ( tartalom_méret ); if ( ! tartalom ) { mentve_errno = hiba ; goto aborting_fopen ; } // Olvassa el a fájl teljes tartalmát a tartalommutatóban size_t n ; n = fread ( tartalom , tartalom_méret , 1 , f ); if ( n == 0 ) { // Ne ellenőrizze a feof()-t, mert az fseek() után pufferelt // A POSIX fread() tévedésből errno-t állít be mentve_errno = hiba ; goto aborting_contents ; } // Visszaadja a lefoglalt memóriát és annak méretét * contents_ptr = tartalom ; * contents_size_ptr = contents_size ; // Erőforrás kiadás szakasz a sikerről tisztítás_fopen : fclose ( f ); visszatér EOK ; // Külön szakasz a források véletlen felszabadítására aborting_contents : ingyenes ( tartalom ); aborting_fopen : fclose ( f ); return saved_errno ; } int main ( int argc , char ** argv ) { if ( arg < 2 ) { return EXIT_FAILURE ; } const char * fájlnév = argv [ 1 ]; errno_t errnum ; érvénytelen * tartalom ; méret_t tartalom_méret ; errnum = get_file_contents ( fájlnév , & tartalom , & tartalom_mérete ); if ( errnum ) { charbuf [ 1024 ] ; const char * hiba_szöveg = strerror_r ( errnum , buf , sizeof ( buf )); fprintf ( stderr , "%s \n " , hiba_szöveg ); kilépés ( EXIT_FAILURE ); } printf ( "%.*s" , ( int ) contents_size , contents ); ingyenes ( tartalom ); return EXIT_SUCCESS ;

Programozási nyelvek
Sztori Kronológia
Ada ALGOL szerelő APL ALAPVETŐ C C++ C# D Delphi COBOL Erlang F# Tovább Fortran megy Haskell Jáva JavaScript Julia Kotlin Selypít Lua MATLAB Célkitűzés-C OCaml Pascal Perl PL/SQL PHP Piton rubin Rozsda Scala UNIX Shell Csevej Gyors Visual Basic .NET Zig
Kategória Listák: kronologikus kategória szerint

C programozási nyelv
ANSI C C89 és C90 C99 C11 C17 C2x Beágyazott C MISRA C
Fordítók	Borland Turbo C Csengés GCC LCC Pelles C PCC TCC Visual C++ C++/CLI C++/CX Watcom C/C++ fordító
Könyvtárak	C Standard Library glibc dietlibc uclibc Newlib eglibc Bionic izom
Sajátosságok	Üzemeltetők C-string Szintaxis Előfeldolgozó fejléc fájlok ablakok.h Adattípusok Funkciók
Néhány leszármazott	C++ C-- C# D Célkitűzés-C Gyors Jáva Alef_ Börtön megy Vala
C és más nyelvek	C és C++ ( kompatibilitás operátorok ) Pascal és C összehasonlítása C fordító Java bájtkódra
Kategória:C programozási nyelv

C (programozási nyelv)

Történelem

Általános információk

Szintaxis és szemantika

Tokenek

Megjegyzések

Operátorok

Kifejezések

Ellenőrző utasítások

Változók

Funkciók

Adattípusok

Primitív típusok

Strings

Egyéni típusok

Előfeldolgozó

C programozás

Programstruktúra

Munka a memóriával

Hibakezelés

Példák C programokra

Fejlesztő eszközök

Hatókör

Leszármazott nyelvek

C++

Objective-C

Problémák és kritika

Általános kritika

A nyelv egyes elemeinek hátrányai

A nyelv hiányosságainak kiküszöbölésének módjai

Lásd még

Jegyzetek

Megjegyzések

Források

Irodalom

Linkek