Microsoft predstavlja MarkItDown, alat za pretvaranje vaših dokumenata u Markdown

MarkItDown

Prije nekog vremena, nedugo nakon objavljivanja a vodič za Markdown, tražio sam informacije da saznam može li se LibreOffice koristiti za kreiranje ovih vrsta dokumenata. Nisam našao ništa osim odgovora tipa "zašto to želiš da radiš?" count. Ideja je bila da se napravi dokument pomoću uređivača tipa Word ili Writer, a zatim da se sačuva u .md formatu, ali kao što sam rekao; Nisam našao ništa. Nedavno je Microsoft objavio alat za nešto slično, a zove se MarkItDown.

MarkItDown je a python biblioteka koji se može instalirati na sistem — ne na Linux od Python-a 3.12 — ili u virtuelnom okruženju (env). Nakon instalacije, osnovna ili sirova upotreba bi zahtijevala pisanje nekoliko redaka u Python-u, koji imate ispod. Ali to nije jedini način da ga koristite.

MarkItDown koristeći Python

API je ovako jednostavan:

from markitdown import MarkItDown markitdown = MarkItDown() rezultat = markitdown.convert("test.xlsx") print(result.text_content)

Iz gore navedenog, prvi red uvozi biblioteku; drugi stvara kompatibilan objekat; U trećem izvodi konverziju — u datoteku koja se u primjeru zove text.xlsx — a u četvrtoj će ispisati rezultat u konzoli. Nadalje, kako je objašnjeno u vaš GitHub, može biti kompatibilan sa LLM kao što je ChatGPT, sve to po ukusu potrošača iu zavisnosti od znanja svake osobe.

Ako kod nije ono što je najbolje za nas, kreirao je programer po imenu Matt Palmer web da olakša zadatak. Iako je na engleskom, upotreba je vrlo jednostavna. Na dnu okvira prikazuje podržane datoteke, a to su PDF, PPTX, DOCX, XLSX, slike, audio, HTML i tekstualne datoteke. Jedina stvar koju ćemo morati da uradimo je da prevučemo datoteku u kutiju i sačekamo da se desi magija, kao što se vidi na snimku ekrana zaglavlja.

U trenutku pisanja postoji problem pri preuzimanju datoteke, koja umjesto teksta prikazuje poruku o grešci. Moguće je, nešto što nisam provjerio, da vidim jer sam kreirao datoteku iz Linuxa, LibreOfficea ili oboje, ali vidim tu grešku prilikom preuzimanja datoteke. Dobro obavlja konverziju i uvijek možete kopirati običan tekst koji generiše, zalijepiti ga u tekstualnu datoteku i spremiti ga sa ekstenzijom .md.

Da bismo ga vidjeli, u Linuxu možemo koristiti alate kao što su Okular, Visual Studio Code ili neki program. ona je spremna, između ostalog.

Da se uzme u obzir

Iako je alat kreirao Microsoft, neće uvijek sve ići kako treba. Da biste postigli najbolje rezultate, morate koristiti ispravne opcije. Na primjer, staviti a # Titular o ## Título 2, morate to odabrati u opcijama Word ili Writer. Isto je i sa poređanim ili neuređenim listama, linkovima, slikama... Ako umjesto ispravnih opcija, izaberemo tekst i stavimo podebljani i veći font, Markdown ne funkcionira tako i možemo dobiti mješovite rezultate. Za više informacija o podržanim brendovima, upućujemo vas na link koji ćete pronaći u prvom pasusu ove napomene.

Sada je to službeni Microsoftov alat i možda je najbolja opcija za pretvaranje podržanih datoteka u Markdown.


Ostavite komentar

Vaša e-mail adresa neće biti objavljena. Obavezna polja su označena sa *

*

*

  1. Odgovoran za podatke: AB Internet Networks 2008 SL
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obavezi.
  5. Pohrana podataka: Baza podataka koju hostuje Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.