kryptoanaliza szyfru przesuwającego

0

Witam mam parę pytań odnośnie mojego projektu z wprowadzenia do programowania. Mój temat projektu to "Kryptoanaliza szyfru przesuwającego" czyli np. szyfr cezara, myślę że chyba wiecie o co chodzi i nie muszę tłumaczyć.
W projekcie mam zaszyfrować tekst przesuwając go o ileś znaków przy pomocy kluczu, oraz odszyfrować tekst przy pomocy specjalizacji języka polskiego nie znając klucza.
Co do zaszyfrowania to nie miałem z tym większego problemu ale zrobiłem go na stringach które wprowadzam z klawiatury, a moje pytanie to przy pomocy jakich funkcji mogę zapisać tekst z jakiegoś pliku .txt do stringa? lub jak inaczej to zrobić. Wiem mniej więcej jak się wczytuje pliki itp. ale nie umiem wczytany plik zapisać do zmiennej string, mógłby mi ktoś pomóc jak z tym sobie poradzić?

Z góry dziękuję za pomoc :D

1
string tekst;
ifstream file("plik.txt");
getline(file,tekst);
//i voila, mamy wczytaną linię z pliku do zmiennej tekst
0

aaa dzięki :D a jest jeszcze możliwość aby wczytać wszystkie linii tego tekstu do jednej zmiennej a nie tylko po jednej linijce?

1
getline(file,tekst, znakNieWystepujacyWPlikuTekstowymNpZero);
1

Skoro to stringi, to za pomocą += (jest przeciążony) można wrzucać poszczególne linijki do jednego długiego stringa. Wtedy nie będzie ryzyka że ten znak jednak wystąpi w którymś z kolejnych plików do złamania.

1

Właściwie to szyfr cezara przewiduje tylko ograniczony alfabet.
Jeżeli będzie przewidywał wszystkie znaki ASCII to nie wczytasz go w trybie tekstowym ponieważ będzie tam też znak 0x1A - sztuczny EOF.
Więc jeżeli otwierasz plik nie w trybie binarnym to getline tak jak podał MarekR22 ze znakiem 0x1A wczyta ci dokładnie tyle ile byś wczytał serią getline'ów.

0

Ok wielkie dzięki panowie już wiem mniej więcej wszystko. Hm a jeszcze jedno pytanko do którego nie jestem pewny:
Aby odszyfrować tekst to muszę zliczyć wszystkie litery (plik który wczytamy to jest plik z samymi literkami plus spacja, nie występują w nim żadne znaki) następnie policzyć ile jest pojedynczo znaków a,b,c... i tak dalej gdy to zrobię to muszę liczbę znaków podzielić przez ilość w ten sposób obliczę procentową ilość, i następnie muszę to jakoś porównywać do specyfikacji języka polskiego, czyli rzutować na kod ASCII i przesuwać aż literka a nie wystąpi tam np. 9% literka d 3% itp?
Czy ktoś ma może jakiś inny pomysł aby to rozwiązać? i jak przybrać wartość o ile może ilość procentowa języka polskiego odbiegać od ilości procentowej w moim tekście (zakładają że to będzie długi tekst).

1

nie masz zbyt wiele kombinacji. ile jest liter w jezyku polskim?
przygotuj sobie "obliczacz" "odleglosci" pomiedzy rozkladami "polskim-zwyklym" a owym "z tekstu zaszyfrowanego", przeiteruj wg liczby liter = liczby mozliwych przesuniec, i wybadaj ktore przesuniecie wygeneruje najmniejsza "odleglosc/roznice" miedzy rozkladami. nie potrzebujesz okreslac "granicznej odleglosci" - wybierz to przesuniecie, ktorr okaze sie byc najmniej różniące się rozkladem, albo np. trzy najmniej różniace sie, jeżeli tekst jest krótki, itp.

0

@rohiden zrób sobie najpierw statystykę dla jakiegoś długiego tekstu w języku polskim (książka jakaś na przykład) a potem dla tego zaszyfrowanego tekstu i porównać. google: kryptoanaliza statystyczna.

0

Mam pytanie dlaczego ta funkcja nie wyświetla mi na ekranie zawartości pliku? (przynajmniej pierwszej linii?
jak to inaczej zapisać, oraz jak dodawać te linie tekstu do siebie?

 
int zaszyfrowywanie()
{
	string tekst,nazwa_pliku;
	cout<<"podaj nazwe pliku do zaszyfrowania z rozszerzeniem\nnp.'text.txt'";
	cin>>nazwa_pliku;
	ifstream plik;
	plik.open("nazwa_pliku");
	if(!plik)
	{
		cout<<"brak pliku"<<endl; 
		return 0;
	}
	plik>>tekst;
	cout<<tekst;
	plik.close();
	return 1;
}

wyskakuje mi stale komunikat brak pliku.
co jest nie tak??

0

spróbuj podać pełną ścieżkę.

1

Co do metod analizy, to zaczął bym od szukania pojedynczych liter a nie słów (w polskim będzie to a, i, albo z o ile się nie mylę, tak więc starczy że tylko raz wystąpi spacja(znak)spacja i już mamy tylko 3 możliwe klucze do sprawdzenia ), a potem 2 i 3 literowych wyrazów (też mocno ograniczona ilość). To znacznie przyśpieszy analizę. No chyba że "odgórne" ograniczenia wykluczają atak słownikowy.

1

To znowu ja, ze względu na dużą odległość czasową w nowym poście. Jeśli spacja(znak)spacja wystąpi więcej niż raz, to mamy rozwiązanie bo w przypadku szyfru cezara odległość między literami pozostaje stała (np jeśli założyć że pl litery w tekście występują to między z i a będzie zawsze 3, bo tylko ż i ź po drodze, klucz szyfrujący nie ma na to wpływu). Tak wiec starczy palnąć te odległości "na sztywno" w jakąś strukturę żeby szybko i łatwo złamać kod. Tak samo można wziąć słownik z modułu sprawdzania pisowni Firefoksa czy innego libreoffice-a i wyliczyć odległości między poszczególnymi literami słów (tu na pewno będą się powtarzać, ale i tak znacznie ograniczymy bazę kluczy do sprawdzenia)

0

a mam jeszcze jeden problem: mianowicie gdy wywołuję tą funkcję:

void zaszyfrowywanie(string tekst,int klucz)
{
	string kopia=tekst;
	int i=0;
	while(kopia[i])
	{
		if((int)kopia[i]<=65 && (int)kopia[i]>=90)
				kopia[i]=(int)kopia[i]+32;	
		if(kopia[i]=' ')
			i++;
		kopia[i]=(int)kopia[i]+klucz;
		i++;
	}
	cout<<kopia;
	ofstream zapis;
	zapis.open("zaszyfrowane.txt");
	zapis<<"Tekst zostal zaszyfrowany\n"<<kopia;
	zapis.close();
}

wyskakuje mi błąd a mianowicie: user image
a i zaznaczam że mam Visuala 2010

1

while(i<kopia.length())
nie musisz działać na kopii ponieważ tekst już jest kopią tego co przekazałeś.
wewnątrz pętli musisz wszystko zrobić na if else lub po każdym zwiększeniu zmiennej "i" znowu sprawdzać warunek.

0

Ok wielkie dzięki za szybką odpowiedź :D
a mam jeszcze pytanko:
jak wsiąść warunek aby jak mam np. literkę 'z' i przesuwam ją o 5 przesunęło ją na 'e'
ja wpadłem na coś takiego, ale coś nie działa :)

		else if(((int)tekst[i]+klucz)>122)
		{
			tekst[i]=((int)tekst[i]+(klucz-25));
		}
0

Zdefiniuj nie działa. błędami sypie? nie takie wyniki daje?

1

kto ci karze operować kodami ASCII? to się potem źle czyta i nie wiadomo co to jest to 122!
Nie lepiej:

if ('a'<=tekst[i] && tekst[i]<='z')
{
     assert(klucz>=0 && klucz<='z'-'a');
     if (tekst[i]+klucz<='z')
         tekst[i]= tekst[i]+klucz;
     else
         tekst[i]= tekst[i]+klucz - ('z' - 'a');
}
0

Witam, mam problem z takim samym programem.

Deszyfrowanie rozwiązuję tak, że liczę procentową zawartość każdej liczby, po każdym przesunięciu całego tekstu o jedną pozycję w prawo.
Następnie od znanej mi charakterystyki języka ang, odejmuję zawartości procentowe odpowiednich liter, wygląda to mniej więcej tak:
Wiem, że literka a występuje w tekscie w jez ang ok. 8.2% . W moim przesuniętym tekście występuje np. 5% . Dalej 8.2 - 5 = 3.2

Robię tak w przypadku każdej litery, i tam gdzie suma różnic wyjdzie najmniejsza, tam tekst jest poprawnie odszyfrowany.

Jednak w moim kodzie jest coś nie tak, gdyż funkcja źle mi liczy ilość poszczególnych liter. W pierwszej iteracji jest ok, jednak w następnych coś się psuje. Mógłby ktoś spojrzeć i w razie wykrycia błędu napisać co jest źle?

string deszyfr(string tekst, int n) //funkcja deszyfrujaca
{
	double licz_lit = 0, suma = 0, litery, roznica;
	int k = 'A';
	double tab[26], tab2[26];
	double proc_lit = 0;
	char b=65;
	
	double jezyk[26]= {8.2,1.5,2.8,4.3,12.7,2.2,2,6.1,7,0.2,0.8,4,2.4,6.7,7.5,1.9,0.1,6,6.3,9.1,2.8,1,2.4,0.2,2,0.1};

	litery = licz_litery(tekst,n); 
for(int m=0; m<3; m++)
{
	for(int i=0; i<n; i++)// przesuwanie tekstu o jedna pozycje w prawo
	{
		if((tekst[i]>='a' && tekst[i]<='z') || (tekst[i]>='A' && tekst[i]<='Z'))// bierzemy pod uwagę tylko litery
		{
			if(tekst[i]=='z'|| tekst[i]=='Z')
				tekst[i]=tekst[i]-26;
			
			tekst[i]=tekst[i]+1;
		}
	}

	b=65;
	for(int i=0; i<26; i++,k++) // 26 liter w alfabecie ang
	{
		
		licz_lit=0;
		for(int j=0; j<n ;j++) // liczenie kolejnych liczb w tekscie
		{

			if(tekst[j]==k || tekst[j]==k+32)
				licz_lit++;
		}
		cout<<b++<<"\t"<<licz_lit<<endl;
		

		proc_lit = ((licz_lit/litery)*100); // liczenie % zawartosci kolejnych liter
		tab[i] = proc_lit; // w tablicy zapisuje zawartosc % kolejnych liter

	

		roznica = jezyk[i] - tab[i];
		roznica = sqrt(roznica*roznica);
		tab2[i] = roznica;
		suma+=tab2[i];
		
	}

cout<<"\n\nNEXT"<<endl;

}


//for(int i=0; i<26; i++)
//	cout<<tab2[i]<<endl;

	return tekst;
}

Na razie wszystko jest dość chaotycznie za co przepraszam!

W razie czego, tu jest cały kod:
http://pastebin.com/HyvDi6T7

Pozdrawiam

0

Spojrzy ktoś?

1 użytkowników online, w tym zalogowanych: 0, gości: 1