Taslağı koruyan bir PDF içerik özetleyici — bölüm bazında, yığına düzleştirilmemiş.
Çoğu özetleyici her şeyi birleştirir ve belgenin şeklini kaybeden tek bir paragraf döndürür. Bu araç Özet, Yöntem, Bulgular, maddeleri ve bölümleri ayrı ayrı tespit eder — sonra özgün hiyerarşi hayatta kalsın diye bölüm başına bir TL;DR yazar.
Yapı korundu, düzleştirilmedi.
40 sayfalık bir PDF, tek bir şeyin 40 sayfası değildir — bir taslaktır. Özetleyici de bir taslak döndürmelidir.
Çoğu LLM özetleyici bir PDF'i parçalar, her parçayı özetler ve sonucu tek bir nesir paragrafında birleştirir. Bu çıktı tweetler için uygundur ama şekli olan belgeler için işe yaramaz — araştırma makaleleri, sözleşmeler, yönetim kurulu raporları, çok bölümlü el kitapları.
Yapı bilen bir özetleyici bunun yerine önce belgenin gerçek hiyerarşisini tespit eder — Özet, Yöntem, Bulgular, Tartışma veya Madde 1, Madde 2, Madde 3 — ve tespit edilen bölüm başına bir TL;DR yazar. Çıktının kendisi bir taslaktır, kaynağı yansıtır.
Fark, bir şey aramanız gerektiğinde önemlidir. Düz bir yığınla, fiyatlandırma ile ilgili kısmı bulmak için tüm özeti yeniden okursunuz. Bölüm başına TL;DR'lerle doğrudan "Madde 4 · Fiyatlandırma"ya atlar ve kaynak paragrafa bağlantıyla 2 satırlık bir cevap bulursunuz.
Şekli olan belgeler için tasarlandı.
PDF'inizin bölümleri, maddeleri, satır öğeleri veya gündem blokları varsa, bölüm başına özet düz olanın yok ettiği şeyi korur.
Bölüm tespiti nasıl çalışır.
Başlık tespiti dil sorunu olmadan önce bir tipografi sorunudur. Boru hattı sayfayı bir tasarımcı gibi okur, sonra bir editör gibi özetler.
x, y, fontSize, weight ve page alır. Aynı meta verinin var olması için taranmış PDF'ler önce OCR'lanır.1.1.2, I.A) hiyerarşi derinliğini doğrular.Çıktı biçimleri — ihtiyacınız olan şekli seçin.
Aynı hiyerarşik çıkarım, üç görüntüleme modu. Yeniden özetlemeden aralarında geçiş yapın.
Ne aldığınız vs düz bir özet.
Her ikisi de metin üretir. Yalnızca biri belgeyi korur.
- closeTaslağı kaybeder. Yöntem ve Tartışma aynı nesir akışına bulanır.
- closeBölümler arası alıntılar. Bulgular'dan bir iddia Yöntem'deki bir pasaja atfedilebilir.
- closeGezinme yok. Bir konu bulmak için özeti yeniden okursunuz.
- closeUzunluk anlamı çökertir. 40 sayfalık bir sözleşme 200 kelime olur; maddeler kaybolur.
- closeYapısal dışa aktarımı zor. Word belgesinde başlık yoktur.
- checkTaslak korunur. Her Özet, Yöntem, madde veya bölüm kendi bloğuna sahiptir.
- checkBölüm kapsamlı alıntılar. Yöntem'deki bir madde yalnızca Yöntem pasajlarını alıntılar.
- checkKonuya atla. "Madde 4"e tıklayın ve tüm özeti yeniden taramak yerine 60 kelime okuyun.
- checkUzunluk derinliğe uyum sağlar. Uzun bölümler otomatik olarak daha uzun özetler alır.
- checkYapısal dışa aktarım. H1/H2 stilleriyle DOCX, uygun başlık seviyeleriyle Markdown.
Bölüm bilen ne zaman gerçekten önemlidir.
İki sayfalık bir memonun buna ihtiyacı yoktur. Kırk sayfalık bir sözleşmenin vardır.
Geri kalan gizlilik yığını ile birleştirin.
Özetleme bir parçadır — diğer araçlar etrafındaki belgeyi yönetir.
Sık sorulan sorular
Özetleyici bir PDF'teki bölümleri nasıl tespit ediyor?
Tüm belge için tek özet yerine her bölüm için bir özet alabilir miyim?
PDF'imde açık başlıklar yoksa ne olur?
Bölüm özetlerini Word belgesi olarak dışa aktarabilir miyim?
Her bölüm özeti kendi kaynak alıntılarını içeriyor mu?
Kırk sayfa okumayı bırakın. Kırk TL;DR okumaya başlayın — bölüm başına bir tane.
Bir PDF bırakın, taslağın belirmesini izleyin, bölüm kapsamlı alıntılarla bölüm başına TL;DR alın. Word, Markdown veya PDF'e geri dışa aktarın — yapı sağlam.
auto_awesomeÖzetleyiciyi aç