Witam,
Zostałem poproszony aby napisać program, który umożliwiałby umieszczanie artykułów, napisanych w Word'zie, na stronie internetowej. Napisałem już taki program, który używa tego typu kodu do skopiowania zawartości Word'a:

Word.Application app = new Word.ApplicationClass();
object nullobj = System.Reflection.Missing.Value;
object file = @"C:\Suneetha\Ques.doc";
Word.Document doc = app.Documents.Open(
ref file, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj);
doc.ActiveWindow.Selection.WholeStory();
doc.ActiveWindow.Selection.Copy();
IDataObject data = Clipboard.GetDataObject();
string text = data.GetData(DataFormats.Text).ToString();
Console.WriteLine(text);
doc.Close(ref nullobj, ref nullobj, ref nullobj);
app.Quit(ref nullobj, ref nullobj, ref nullobj);

Następnie skopiowany tekst umieszcza w pliku html i wysyła przez FTP.
Niestety tak odczytany tekst z Word'a jest "czysty" - wszelkie zmiany jakie wprowadziliśmy w Wordzie(czcionka, wielkość, styl) nie są kopiowane. Istnieje opcja w Wordzie, aby zapisać plik jako htm i ładnie to działa, ale daje zbyt dużą kontrole temu co pisze artykuł. Ja chcę żeby on mógł wybrać, że coś jest zwykłym "tekstem", "nagłówkiem", "nagłówkiem 2" (są to chyba standardowe style w każdym word'zie) i tyle. Mój program miałby skopiować tekst razem z informacją o stylu(każdy inny niż te które wymieniłem by ignorował). Zapisałby owy tekst - artykuł, tak jak już to robi, do html i dodał własną otoczkę pliku(<head>...) oraz wysłał.

Wiem, że namieszałem, ale główne pytanie... Jak skopiować/odczytać tekst z Worda, tak aby wiedzieć w jakim stylu jest dany tekst. Oczywiście w kodzie programu w C#. Proszę o pomoc.