Какой самый лучший способ проверить файл XML против XSD-файл?

голоса
226

Я генерировать некоторые XML-файлы, необходимые для соответствия с XSD файл, который был дан мне. Какой самый лучший способ проверить, что они соответствуют?

Задан 19/08/2008 в 05:59
источник пользователем
На других языках...                            


13 ответов

голоса
294

Библиотека времени выполнения Java поддерживает проверку. Последний раз я проверил это анализатор Apache Xerces под одеялом. Вы , вероятно , следует использовать javax.xml.validation.Validator .

import javax.xml.XMLConstants;
import javax.xml.transform.Source;
import javax.xml.transform.stream.StreamSource;
import javax.xml.validation.*;
import java.net.URL;
import org.xml.sax.SAXException;
//import java.io.File; // if you use File
import java.io.IOException;
...
URL schemaFile = new URL("http://host:port/filename.xsd");
// webapp example xsd: 
// URL schemaFile = new URL("http://java.sun.com/xml/ns/j2ee/web-app_2_4.xsd");
// local file example:
// File schemaFile = new File("/location/to/localfile.xsd"); // etc.
Source xmlFile = new StreamSource(new File("web.xml"));
SchemaFactory schemaFactory = SchemaFactory
    .newInstance(XMLConstants.W3C_XML_SCHEMA_NS_URI);
try {
  Schema schema = schemaFactory.newSchema(schemaFile);
  Validator validator = schema.newValidator();
  validator.validate(xmlFile);
  System.out.println(xmlFile.getSystemId() + " is valid");
} catch (SAXException e) {
  System.out.println(xmlFile.getSystemId() + " is NOT valid reason:" + e);
} catch (IOException e) {}

Постоянная схема завода является строкой , http://www.w3.org/2001/XMLSchemaкоторая определяет XSDs. Приведенный выше код проверяет в WAR дескриптор развертывания против URL , http://java.sun.com/xml/ns/j2ee/web-app_2_4.xsdно вы можете так же легко проверить с локальным файлом.

Вы не должны использовать DomParser для проверки документа (если ваша цель состоит в создании объектной модели документа в любом случае). Это позволит начать создавать объекты DOM, как он разбирает документ - расточительно, если вы не собираетесь их использовать.

Ответил 19/08/2008 в 13:21
источник пользователем

голоса
23

Вот как сделать это с помощью Xerces2 . Учебник для этого, здесь (REQ. Регистрация).

Оригинал атрибуции: нагло скопировано из здесь :

import org.apache.xerces.parsers.DOMParser;
import java.io.File;
import org.w3c.dom.Document;

public class SchemaTest {
  public static void main (String args[]) {
      File docFile = new File("memory.xml");
      try {
        DOMParser parser = new DOMParser();
        parser.setFeature("http://xml.org/sax/features/validation", true);
        parser.setProperty(
             "http://apache.org/xml/properties/schema/external-noNamespaceSchemaLocation", 
             "memory.xsd");
        ErrorChecker errors = new ErrorChecker();
        parser.setErrorHandler(errors);
        parser.parse("memory.xml");
     } catch (Exception e) {
        System.out.print("Problem parsing the file.");
     }
  }
}
Ответил 19/08/2008 в 06:10
источник пользователем

голоса
19

Мы строим наш проект с помощью муравьев, поэтому мы можем использовать задачу schemavalidate, чтобы проверить наши конфигурационные файлы:

<schemavalidate> 
    <fileset dir="${configdir}" includes="**/*.xml" />
</schemavalidate>

Теперь непослушные конфигурационные файлы будут терпеть неудачу нашей сборки!

http://ant.apache.org/manual/Tasks/schemavalidate.html

Ответил 14/07/2011 в 09:01
источник пользователем

голоса
10

Я нашел этот сайт, чтобы быть полезным, тоже.

http://www.ibm.com/developerworks/xml/library/x-javaxmlvalidapi.html

Это тот, который на самом деле работал на меня с минимумом суеты.

Ответил 08/05/2009 в 21:11
источник пользователем

голоса
7

Так как это популярный вопрос, я хотел бы также отметить, что Java можно проверить против «ссылки на» XSD, например , если сам XML - файл определяет XSD, используя xsi:SchemaLocationили xsi:noNamespaceSchemaLocation(или XSI для определенных пространств имен) , как указано здесь :

<document xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:noNamespaceSchemaLocation="http://www.example.com/document.xsd">
  ...

или SchemaLocation (всегда список имен для XSD отображений)

<document xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:SchemaLocation="http://www.example.com/document http://www.example.com/document.xsd">
  ...

«Если создать схему без указания URL, файл или источника, то язык Java создает тот, который выглядит в документе проверяемым найти схему, которую необходимо использовать, например:.»

SchemaFactory factory = SchemaFactory.newInstance("http://www.w3.org/2001/XMLSchema");
Schema schema = factory.newSchema();

и это работает для нескольких пространств имен и т.д. Проблема с этим подходом является то , что xmlsns:xsi, вероятно , является сетевым расположением, так что он будет выходить на улицу и попал в сеть с каждой и каждой проверкой, не всегда оптимален.

Вот пример, который проверяет файл XML против нее ссылается любой XSD (даже если у него есть, чтобы вытащить их из сети):

  public static void verifyValidatesInternalXsd(String filename) throws Exception {
    InputStream xmlStream = new new FileInputStream(filename);
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    factory.setValidating(true);
    factory.setNamespaceAware(true);
    factory.setAttribute("http://java.sun.com/xml/jaxp/properties/schemaLanguage",
                 "http://www.w3.org/2001/XMLSchema");
    DocumentBuilder builder = factory.newDocumentBuilder();
    builder.setErrorHandler(new RaiseOnErrorHandler());
    builder.parse(new InputSource(xmlStream));
    xmlStream.close();
  }

  public static class RaiseOnErrorHandler implements ErrorHandler {
    public void warning(SAXParseException e) throws SAXException {
      throw new RuntimeException(e);
    }
    public void error(SAXParseException e) throws SAXException {
      throw new RuntimeException(e);
    }
    public void fatalError(SAXParseException e) throws SAXException {
      throw new RuntimeException(e);
    }
  }

Вы можете избежать потянув ссылку XSD от сети, даже если XML - файлы , ссылки на URL, указав XSD вручную (см некоторых других ответов здесь) , либо с помощью «каталога XML» стиль распознавателя . Весна , по- видимому , также может перехватить запросы URL обслуживать локальные файлы для валидаций. Или вы можете установить свой собственный с помощью setResourceResolver , экс:

Source xmlFile = new StreamSource(xmlFileLocation);
SchemaFactory schemaFactory = SchemaFactory
                                .newInstance(XMLConstants.W3C_XML_SCHEMA_NS_URI);
Schema schema = schemaFactory.newSchema();
Validator validator = schema.newValidator();
validator.setResourceResolver(new LSResourceResolver() {
  @Override
  public LSInput resolveResource(String type, String namespaceURI,
                                 String publicId, String systemId, String baseURI) {
    InputSource is = new InputSource(
                           getClass().getResourceAsStream(
                          "some_local_file_in_the_jar.xsd"));
                          // or lookup by URI, etc...
    return new Input(is); // for class Input see 
                          // https://stackoverflow.com/a/2342859/32453
  }
});
validator.validate(xmlFile);

Смотрите также здесь для другого учебника.

Ответил 19/12/2016 в 14:57
источник пользователем

голоса
4

Использование Java 7 вы можете следить за документацию , представленную в описании пакета .

// parse an XML document into a DOM tree
DocumentBuilder parser = DocumentBuilderFactory.newInstance().newDocumentBuilder();
Document document = parser.parse(new File("instance.xml"));

// create a SchemaFactory capable of understanding WXS schemas
SchemaFactory factory = SchemaFactory.newInstance(XMLConstants.W3C_XML_SCHEMA_NS_URI);

// load a WXS schema, represented by a Schema instance
Source schemaFile = new StreamSource(new File("mySchema.xsd"));
Schema schema = factory.newSchema(schemaFile);

// create a Validator instance, which can be used to validate an instance document
Validator validator = schema.newValidator();

// validate the DOM tree
try {
    validator.validate(new DOMSource(document));
} catch (SAXException e) {
    // instance document is invalid!
}
Ответил 13/05/2013 в 10:40
источник пользователем

голоса
3

Еще один ответ: так как вы сказали , что вы должны проверить файлы , которые вы порождающие (запись), вы можете проверить содержимое в то время как вы пишете, а не первое письмо, а затем чтение назад для проверки. Вы , вероятно , может сделать это с JDK API для проверки Xml, если вы используете писатель SAX на основе: если это так, просто ссылку на валидатор по телефону «Validator.validate (источник, результат)», где источник исходит от вашего писателя, и результат где выход должен идти.

Кроме того, если вы используете Stax для содержания письма (или в библиотеке , которая использует или может использовать StAX), Woodstox могут также непосредственно поддерживать проверку при использовании XMLStreamWriter. Вот запись в блоге , показывающий , как это делается:

Ответил 27/03/2009 в 17:25
источник пользователем

голоса
2

Если у вас есть Linux-машины, вы можете использовать бесплатный инструмент командной строки SAXCount. Я нашел это очень полезно.

SAXCount -f -s -n my.xml

Он проверяет против ОТДА и XSD. 5s для файла 50MB.

В Debian выдавить он находится в пакете «libxerces-C-образцов».

Определение ОТДА и XSD должно быть в XML! Вы не можете сконфигурировать их по отдельности.

Ответил 22/03/2012 в 18:01
источник пользователем

голоса
2

Если вы создаете XML файлы программно, вы можете захотеть взглянуть на XMLBeans библиотеке. С помощью инструмента командной строки, XMLBeans будет автоматически генерировать и упаковать множество объектов Java , основанных на XSD. Затем вы можете использовать эти объекты для создания документа XML на основе этой схемы.

Он имеет встроенную поддержку для проверки схемы, и может конвертировать Java объектов в документ XML и наоборот.

Касторовое и JAXB другие библиотеки Java , которые служат той же цели , к XMLBeans.

Ответил 28/01/2009 в 19:06
источник пользователем

голоса
0

Подтвердить против интернет-схем

Source xmlFile = new StreamSource(Thread.currentThread().getContextClassLoader().getResourceAsStream("your.xml"));
SchemaFactory factory = SchemaFactory.newInstance(XMLConstants.W3C_XML_SCHEMA_NS_URI);
Schema schema = factory.newSchema(Thread.currentThread().getContextClassLoader().getResource("your.xsd"));
Validator validator = schema.newValidator();
validator.validate(xmlFile);

Проверка против местных схем

Offline Проверка XML с Java

Ответил 04/10/2018 в 11:36
источник пользователем

голоса
0

С JAXB, вы можете использовать следующий код:

    @Test
public void testCheckXmlIsValidAgainstSchema() {
    logger.info("Validating an XML file against the latest schema...");

    MyValidationEventCollector vec = new MyValidationEventCollector();

    validateXmlAgainstSchema(vec, inputXmlFileName, inputXmlSchemaName, inputXmlRootClass);

    assertThat(vec.getValidationErrors().isEmpty(), is(expectedValidationResult));
}

private void validateXmlAgainstSchema(final MyValidationEventCollector vec, final String xmlFileName, final String xsdSchemaName, final Class<?> rootClass) {
    try (InputStream xmlFileIs = Thread.currentThread().getContextClassLoader().getResourceAsStream(xmlFileName);) {
        final JAXBContext jContext = JAXBContext.newInstance(rootClass);
        // Unmarshal the data from InputStream
        final Unmarshaller unmarshaller = jContext.createUnmarshaller();

        final SchemaFactory sf = SchemaFactory.newInstance(XMLConstants.W3C_XML_SCHEMA_NS_URI);
        final InputStream schemaAsStream = Thread.currentThread().getContextClassLoader().getResourceAsStream(xsdSchemaName);
        unmarshaller.setSchema(sf.newSchema(new StreamSource(schemaAsStream)));

        unmarshaller.setEventHandler(vec);

        unmarshaller.unmarshal(new StreamSource(xmlFileIs), rootClass).getValue(); // The Document class is the root object in the XML file you want to validate

        for (String validationError : vec.getValidationErrors()) {
            logger.trace(validationError);
        }
    } catch (final Exception e) {
        logger.error("The validation of the XML file " + xmlFileName + " failed: ", e);
    }
}

class MyValidationEventCollector implements ValidationEventHandler {
    private final List<String> validationErrors;

    public MyValidationEventCollector() {
        validationErrors = new ArrayList<>();
    }

    public List<String> getValidationErrors() {
        return Collections.unmodifiableList(validationErrors);
    }

    @Override
    public boolean handleEvent(final ValidationEvent event) {
        String pattern = "line {0}, column {1}, error message {2}";
        String errorMessage = MessageFormat.format(pattern, event.getLocator().getLineNumber(), event.getLocator().getColumnNumber(),
                event.getMessage());
        if (event.getSeverity() == ValidationEvent.FATAL_ERROR) {
            validationErrors.add(errorMessage);
        }
        return true; // you collect the validation errors in a List and handle them later
    }
}
Ответил 27/11/2017 в 15:25
источник пользователем

голоса
0

Вы ищете инструмент или библиотеку?

Что касается библиотек идет, в значительной степени стандартом де-факто является Xerces2 , который имеет как C ++ и Java версии.

Будьте осторожны, хотя передний, это тяжелый раствор веса. Но опять же, проверки XML против XSD файлов является довольно тяжелой проблемой веса.

Что касается инструмента , чтобы сделать это для вас, XMLFox , кажется, порядочный бесплатное решение, но не использовав его лично , я не могу сказать наверняка.

Ответил 19/08/2008 в 06:11
источник пользователем

голоса
-2

Я должен был проверить в XML против XSD только один раз, поэтому я попытался XMLFox. Я нашел, что это очень запутанным и странным. Инструкции помогают, похоже, не соответствуют интерфейсу.

Я закончил с использованием LiquidXML Studio 2008 (v6), который был гораздо проще в использовании и более непосредственно знакомы (интерфейс очень похож на Visual Basic 2008 Express, который я использую часто). Недостаток: способность проверки не в бесплатной версии, так что я должен был использовать 30-дневную пробную версию.

Ответил 01/10/2008 в 18:35
источник пользователем

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more